Data Science

Projet

Top 5 de projets pour débuter en NLP

Pour décrocher votre premier boulot en NLP, il vous faudra justifier d’un minimum d’expériences. Travailler sur des projets pratiques est l’une des meilleures façons d’acquérir de l’expérience et donc des compétences dans le domaine. Dans cet article je vous présente 5 projets relativement simples par lesquels vous pouvez débuter votre apprentissage en NLP. Il s’agit …

Top 5 de projets pour débuter en NLP Lire la suite »

Logo MapReduce

Le paradigme MapReduce

Depuis l’apparition du Big Data, les méthodes, architectures et outils de traitement de gros volumes de données n’ont cessé d’émerger : MapReduce, Hadoop, Spark, etc. MapReduce, créé par le géant Google, va être très vite adopté comme framework pour faire les opérations de calculs distribués et de parallélisation. Dans cet article, nous allons à la …

Le paradigme MapReduce Lire la suite »

PyTorch

Débuter avec PyTorch

PyTorch est un Framework Python de calcul scientifique développé par Facebook. Il a deux objectifs principaux : Un remplacement de NumPy pour utiliser la puissance des GPU et d’autres accélérateurs. Une bibliothèque de différenciation automatique Autograd qui est utile pour entraîner des réseaux de neurones. Dans cette introduction à PyTorch, je présente brièvement les tenseurs …

Débuter avec PyTorch Lire la suite »

Top 10 des livres de data science

De nos jours, on peut acquérir la connaissance de plusieurs façons soit au travers d’articles de blog, de MOOC, de vidéos YouTube,.., sans oublier les bons vieux classiques : les livres.J’apprécie particulièrement les livres, car j’arrive à avoir une connexion assez particulière avec eux. J’ai beaucoup appris ces dernières années grâce aux livres. Il n’y …

Top 10 des livres de data science Lire la suite »

Illustration transfer learning

Introduction au Transfer Learning

Le transfer learning a vu sa cote de popularité exploser dans le domaine du machine learning. L’une des principales raisons de son succès, c’est le fait de pouvoir utiliser les connaissances obtenues en effectuant une tâche afin de résoudre un problème différent, mais qui présente des similitudes. Dans cet article, nous présenterons ce qu’est le …

Introduction au Transfer Learning Lire la suite »

Séries temporelles

K-means sur des séries temporelles

J’ai récemment été amené à travailler sur un projet qui avait pour but d’étudier des données remontées par des capteurs. Il s’agissait d’un projet d’IoT et j’ai eu besoin de faire du clustering sur les valeurs remontées par les capteurs, qui sont en fait des séries temporelles. J’ai donc décidé d’appliquer un algorithme de clustering …

K-means sur des séries temporelles Lire la suite »

RCNN-Recu

Reconnaissance de caractères sur des reçus à l’aide du Faster R-CNN

En tant qu’êtres humains nous avons la capacité de transférer les connaissances acquises pour une tâche spécifique dans une autre tâche. Plus cette tâche est facile, plus il est facile d’utiliser ses connaissances. Par exemple : savoir faire du vélo peut être utilisé comme base pour apprendre à rouler une moto. C’est ce principe qu’utilise l’apprentissage …

Reconnaissance de caractères sur des reçus à l’aide du Faster R-CNN Lire la suite »

data visualisation

Introduction à la data visualisation

Pouvoir visualiser ses données lorsqu’on les manipule est une nécessité. Observer des graphes nous permet d’anticiper certains problèmes et de mieux peaufiner nos futures analyses. Dans cet article introductif, nous présenterons ce qu’est la data visualisation, différents types de visualisations, quand et comment les utiliser, et les librairies python de visualisation des données les plus …

Introduction à la data visualisation Lire la suite »