Data Science

serie_temporelle

Série temporelle – Prévision avec ARIMA

L’une des méthodes de prévision de séries temporelles les plus répandues est la méthode ARIMA. ARIMA signifie : AutoRegressive Integrated Moving Average. Il s’agit d’un modèle qui prédit les valeurs futures d’une série temporelle sur certains aspects de la structure statistique de la série observée. Dans cet article nous verrons, de façon succincte, quel est le …

Série temporelle – Prévision avec ARIMA Lire la suite »

Projet

Top 5 de projets pour débuter en NLP

Pour décrocher votre premier boulot en NLP, il vous faudra justifier d’un minimum d’expériences. Travailler sur des projets pratiques est l’une des meilleures façons d’acquérir de l’expérience et donc des compétences dans le domaine. Dans cet article je vous présente 5 projets relativement simples par lesquels vous pouvez débuter votre apprentissage en NLP. Il s’agit …

Top 5 de projets pour débuter en NLP Lire la suite »

Logo MapReduce

Le paradigme MapReduce

Depuis l’apparition du Big Data, les méthodes, architectures et outils de traitement de gros volumes de données n’ont cessé d’émerger : MapReduce, Hadoop, Spark, etc. MapReduce, créé par le géant Google, va être très vite adopté comme framework pour faire les opérations de calculs distribués et de parallélisation. Dans cet article, nous allons à la …

Le paradigme MapReduce Lire la suite »

PyTorch

Débuter avec PyTorch

PyTorch est un Framework Python de calcul scientifique développé par Facebook. Il a deux objectifs principaux : Un remplacement de NumPy pour utiliser la puissance des GPU et d’autres accélérateurs. Une bibliothèque de différenciation automatique Autograd qui est utile pour entraîner des réseaux de neurones. Dans cette introduction à PyTorch, je présente brièvement les tenseurs …

Débuter avec PyTorch Lire la suite »

Top 10 des livres de data science

De nos jours, on peut acquérir la connaissance de plusieurs façons soit au travers d’articles de blog, de MOOC, de vidéos YouTube,.., sans oublier les bons vieux classiques : les livres.J’apprécie particulièrement les livres, car j’arrive à avoir une connexion assez particulière avec eux. J’ai beaucoup appris ces dernières années grâce aux livres. Il n’y …

Top 10 des livres de data science Lire la suite »

Illustration transfer learning

Introduction au Transfer Learning

Le transfer learning a vu sa cote de popularité exploser dans le domaine du machine learning. L’une des principales raisons de son succès, c’est le fait de pouvoir utiliser les connaissances obtenues en effectuant une tâche afin de résoudre un problème différent, mais qui présente des similitudes. Dans cet article, nous présenterons ce qu’est le …

Introduction au Transfer Learning Lire la suite »

Séries temporelles

K-means sur des séries temporelles

J’ai récemment été amené à travailler sur un projet qui avait pour but d’étudier des données remontées par des capteurs. Il s’agissait d’un projet d’IoT et j’ai eu besoin de faire du clustering sur les valeurs remontées par les capteurs, qui sont en fait des séries temporelles. J’ai donc décidé d’appliquer un algorithme de clustering …

K-means sur des séries temporelles Lire la suite »

RCNN-Recu

Reconnaissance de caractères sur des reçus à l’aide du Faster R-CNN

En tant qu’êtres humains nous avons la capacité de transférer les connaissances acquises pour une tâche spécifique dans une autre tâche. Plus cette tâche est facile, plus il est facile d’utiliser ses connaissances. Par exemple : savoir faire du vélo peut être utilisé comme base pour apprendre à rouler une moto. C’est ce principe qu’utilise l’apprentissage …

Reconnaissance de caractères sur des reçus à l’aide du Faster R-CNN Lire la suite »