Data Science

data visualisation

Introduction à la data visualisation

Pouvoir visualiser ses données lorsqu’on les manipule est une nécessité. Observer des graphes nous permet d’anticiper certains problèmes et de mieux peaufiner nos futures analyses. Dans cet article introductif, nous présenterons ce qu’est la data visualisation, différents types de visualisations, quand et comment les utiliser, et les librairies python de visualisation des données les plus …

Introduction à la data visualisation Lire la suite »

Logo Doccano

Annotation de jeux de données avec Doccano

Pour faire de l’apprentissage supervisé, l’on a besoin d’un jeu de données annoté (ou labelisé). C’est-à-dire une liste d’exemples qui contient des entrées et leurs sorties correspondantes. Cependant, dans la vraie vie, il est presque rare d’obtenir de la donnée brute déjà annotée. Prenons l’exemple d’un modèle d’analyse de sentiment sur des commentaires laissés par …

Annotation de jeux de données avec Doccano Lire la suite »

facebook prophet

Facebook prophet : La prévision à grande échelle

Prévoir et analyser les données temporelles font partie des challenges en data science (par exemple prévoir la valeur du cours d’un indice boursier).C’est cette problématique que l’outil open source facebook prophet tente de résoudre. Dans cet article, on dissèque la libraire prophet de Facebook et on terminera avec un cas pratique (prévoir le prix du …

Facebook prophet : La prévision à grande échelle Lire la suite »

Loto Deep Learning

Le Deep Learning et le hasard – Prédiction du Loto

L’étude mathématique de la loterie est aussi ancienne que les mathématiques. On peut citer les travaux de Leonard Euler qui ont conduit à la théorie de la probabilité de Kolmogorov [Kolmogorov, 1933]. À ce jour peu d’ouvrages existent sur la résolution du problème très difficile voire impossible de prédire des tirages de numéros de loterie …

Le Deep Learning et le hasard – Prédiction du Loto Lire la suite »

Logo Scrapy

Créer un jeu de données avec Scrapy

L’importance de l’acquisition de données pour le Data Scientist n’est plus à démontrer. Le web étant une source intarissable de données de toutes sortes, le web scraping ou web crawling s’est imposé comme une technique incontournable d’acquisition de données. Scrapy est un framework Python permettant de faciliter les tâches de scraping. Dans cet article nous …

Créer un jeu de données avec Scrapy Lire la suite »

Gradient descent – l’algorithme du gradient

Gradient descent ou algorithme du gradient est un processus itératif qui permet de calculer le minimum d’une fonction. Cet algorithme est beaucoup utilisé en Machine Learning. Dans cet article, nous présenterons l’algorithme du gradient, comment il fonctionne et un exemple pratique. Qu’est-ce que le gradient descent ? Le gradient descent est un algorithme d’optimisation qui …

Gradient descent – l’algorithme du gradient Lire la suite »

Image de couverture

Détection d’Objets avec la librairie GluonCV

Le Deep Learning a permis une avancée notable dans plusieurs domaines de recherche dont le Computer Vision (Vision par Ordinateur in french 😄). Dans cet article, je vous présente l’une des applications du Computer Vision : la détection d’objets avec la librairie Python GluonCV. Présentation de GluonCV GluonCV (Gluon Computer Vision) est une boîte à …

Détection d’Objets avec la librairie GluonCV Lire la suite »

Algorithme Génétique

En Machine Learning, il est fréquent d’utiliser des modèles pour résoudre les problèmes de régression ou de classification. Des modèles tels que K-Nearest Neighbors (KNN), K-Means (Clustering) utilisent des paramètres qui impactent fortement la solution du modèle utilisé.Afin de mieux choisir ces paramètres et avoir ainsi des performances optimales pour nos modèles, nous utilisons des …

Algorithme Génétique Lire la suite »

Classification

Introduction à la catégorisation de textes

La classification (ou catégorisation) de textes est l’une des tâches de traitement du langage naturel (NLP :  Natural Language Processing) les plus courantes. Elle consiste à associer un texte non-structuré à un tag, qui correspond à une classe bien précise. Si la catégorisation de textes nécessite beaucoup d’engouement, c’est à cause de ses nombreuses applications …

Introduction à la catégorisation de textes Lire la suite »