Data Science

Pandas photo

Manipulez vos données avec pandas

L’une des choses les plus importantes en data science ; c’est de pouvoir explorer, transformer, visualiser, comprendre vos données afin d’en retirer le maximum d’informations.  C’est donc le rôle de pandas une bibliothèque python permettant l’analyse et la manipulation de données. Pandas est donc un puissant outil d’analyse et de manipulation de données (open source) facile …

Manipulez vos données avec pandas Lire la suite »

Photo by Benjamin Lizardo on Unsplash

Régression polynomiale avec python

Dans notre précédent article Créer Un Modèle De Régression Linéaire Avec Python, nous avons présenté de façon générale la régression linéaire. Nous aborderons dans cet article le cas de la régression polynomiale. Pour rappel : La régression linéaire est un modèle (analyse) qui a pour but d’établir une relation linéaire entre une variable  (appelée variable …

Régression polynomiale avec python Lire la suite »

algorithme de clustering

Faire du Clustering avec l’algorithme K-means

K-means (k-moyens en français) est un algorithme de clustering. Le clustering est un type d’apprentissage non supervisé (contrairement à la regression linéaire par exemple qui est un type d’apprentissage supervisé). Il consiste à regrouper les éléments de notre jeu de donnée en groupes, appelés clusters. Le but est de faire ressortir les patterns cachés dans …

Faire du Clustering avec l’algorithme K-means Lire la suite »

Streamlit https://www.streamlit.io/

Streamlit : Donnez une vie à vos modèles de ML

Streamlit est un framework open-source Python spécialement conçu pour les ingénieurs en machine learning et les Data scientists.  Ce framework permet de créer des applications web qui pourront intégrer aisément des modèles de machine learning et des outils de visualisation de données. 1. Streamlit : Les bases Contrairement aux autres framework python (Dash, …) pour …

Streamlit : Donnez une vie à vos modèles de ML Lire la suite »

NumPy

A La Découverte De La Célèbre Librairie NumPy

NumPy est l’une des bibliothèques python les plus populaires. L’objectif de cet article sera de présenter les fonctionnalités principales proposées par NumPy et bien plus ! NumPy (Numerical Python) est la bibliothèque la plus populaire de calcul scientifique en Python. Ainsi, elle permet d’effectuer les calculs scientifiques de base et de manipuler assez facilement les …

A La Découverte De La Célèbre Librairie NumPy Lire la suite »

Python pour la data science: les bases du langage

Cet article est le premier de la série d’articles « introduction à la data science avec python ». Dans cette série nous allons nous attaquer à plusieurs facette de la data science (La programmation, le traitement des données, un peu de statistiques, du machine learning et du deep learning). Cette série aura essentiellement pour but de présenter …

Python pour la data science: les bases du langage Lire la suite »

Google Colaboratory

Google Colab : Le guide Ultime

C’est quoi Google Colab ? Google Colab  ou Colaboratory est un service cloud, offert par Google (gratuit), basé sur Jupyter Notebook et destiné à la formation et à la recherche dans l’apprentissage automatique. Cette plateforme permet d’entraîner des modèles de Machine Learning directement dans le cloud. Sans donc avoir besoin d’installer quoi que ce soit …

Google Colab : Le guide Ultime Lire la suite »

Introduction aux séries temporelles

Quand on veut prédire ou juste analyser l’évolution d’une certaine quantité dans le temps, (Le cours de la bourse par exemple) on est très vite confronté un type de données assez particulier : Les séries temporelles. D’après Wikipédia, une série temporelle est une suite de valeurs numériques représentant l’évolution d’une quantité dans le temps. Pourquoi …

Introduction aux séries temporelles Lire la suite »

Y a-t-il une corrélation entre mes variables ?

  L’une des étapes les plus importantes dans un projet de data science est celle qui vient juste avant l’élaboration du modèle. Si on devait se rapporter au modèle CRISP-DM énoncé dans l’article Qu’est-ce que la data science, cette étape correspondrait au « Data understanding ». Il s’agit ici de regarder comment se comportent les différentes variables …

Y a-t-il une corrélation entre mes variables ? Lire la suite »