Data Science Archives | Page 4 sur 5

Manipulez vos données avec pandas

Laisser un commentaire / Data Science / Par Henri Michel

L’une des choses les plus importantes en data science ; c’est de pouvoir explorer, transformer, visualiser, comprendre vos données afin d’en retirer le maximum d’informations. C’est donc le rôle de pandas une bibliothèque python permettant l’analyse et la manipulation de données. Pandas est donc un puissant outil d’analyse et de manipulation de données (open source) facile …

Manipulez vos données avec pandas Lire la suite »

Régression polynomiale avec python

1 commentaire / Data Science / Par Henri Michel

Dans notre précédent article Créer Un Modèle De Régression Linéaire Avec Python, nous avons présenté de façon générale la régression linéaire. Nous aborderons dans cet article le cas de la régression polynomiale. Pour rappel : La régression linéaire est un modèle (analyse) qui a pour but d’établir une relation linéaire entre une variable (appelée variable …

Régression polynomiale avec python Lire la suite »

Faire du Clustering avec l’algorithme K-means

Laisser un commentaire / Data Science / Par Dedocoton

K-means (k-moyens en français) est un algorithme de clustering. Le clustering est un type d’apprentissage non supervisé (contrairement à la regression linéaire par exemple qui est un type d’apprentissage supervisé). Il consiste à regrouper les éléments de notre jeu de donnée en groupes, appelés clusters. Le but est de faire ressortir les patterns cachés dans …

Faire du Clustering avec l’algorithme K-means Lire la suite »

Web Scraping Python avec Selenium

Laisser un commentaire / Data Science, Programmation / Par Dedocoton

Aujourd’hui on va voir comment faire du web scraping avec Selenium. Pour ceux qui ne savent pas ce que c’est que le web scraping cliquez ici. Selenium est un outil d’automatisation de test pour le web. Il permet de créer des « robots » qui naviguent dans des pages webs comme le ferait un vrai utilisateur. Bien …

Web Scraping Python avec Selenium Lire la suite »

Streamlit : Donnez une vie à vos modèles de ML

1 commentaire / Data Science, IA, Programmation / Par Henri Michel

Streamlit est un framework open-source Python spécialement conçu pour les ingénieurs en machine learning et les Data scientists. Ce framework permet de créer des applications web qui pourront intégrer aisément des modèles de machine learning et des outils de visualisation de données. 1. Streamlit : Les bases Contrairement aux autres framework python (Dash, …) pour …

Streamlit : Donnez une vie à vos modèles de ML Lire la suite »

A La Découverte De La Célèbre Librairie NumPy

Laisser un commentaire / Data Science, Programmation / Par Henri Michel

NumPy est l’une des bibliothèques python les plus populaires. L’objectif de cet article sera de présenter les fonctionnalités principales proposées par NumPy et bien plus ! NumPy (Numerical Python) est la bibliothèque la plus populaire de calcul scientifique en Python. Ainsi, elle permet d’effectuer les calculs scientifiques de base et de manipuler assez facilement les …

A La Découverte De La Célèbre Librairie NumPy Lire la suite »

Python pour la data science: les bases du langage

2 commentaires / Data Science, Programmation / Par Henri Michel

Cet article est le premier de la série d’articles « introduction à la data science avec python ». Dans cette série nous allons nous attaquer à plusieurs facette de la data science (La programmation, le traitement des données, un peu de statistiques, du machine learning et du deep learning). Cette série aura essentiellement pour but de présenter …

Python pour la data science: les bases du langage Lire la suite »

Google Colab : Le guide Ultime

3 commentaires / Data Science, IA, Programmation / Par Henri Michel

C’est quoi Google Colab ? Google Colab ou Colaboratory est un service cloud, offert par Google (gratuit), basé sur Jupyter Notebook et destiné à la formation et à la recherche dans l’apprentissage automatique. Cette plateforme permet d’entraîner des modèles de Machine Learning directement dans le cloud. Sans donc avoir besoin d’installer quoi que ce soit …

Google Colab : Le guide Ultime Lire la suite »

Introduction aux séries temporelles

1 commentaire / Data Science / Par Dedocoton

Quand on veut prédire ou juste analyser l’évolution d’une certaine quantité dans le temps, (Le cours de la bourse par exemple) on est très vite confronté un type de données assez particulier : Les séries temporelles. D’après Wikipédia, une série temporelle est une suite de valeurs numériques représentant l’évolution d’une quantité dans le temps. Pourquoi …

Introduction aux séries temporelles Lire la suite »

Y a-t-il une corrélation entre mes variables ?

Laisser un commentaire / Data Science / Par Dedocoton

L’une des étapes les plus importantes dans un projet de data science est celle qui vient juste avant l’élaboration du modèle. Si on devait se rapporter au modèle CRISP-DM énoncé dans l’article Qu’est-ce que la data science, cette étape correspondrait au « Data understanding ». Il s’agit ici de regarder comment se comportent les différentes variables …

Y a-t-il une corrélation entre mes variables ? Lire la suite »