Dedocoton

Génération de données

Générer des données factices (dummy data) avec Faker

Il arrive assez souvent que l’on ait besoin de données factices (dummy data). Que ce soit pour des tests, pour anonymiser des données sensibles ou pour ajouter du « bruit » dans un jeu de données d’entraînement, il peut être intéressant d’avoir accès à un jeu de fausses données ayant la même forme que les données réelles. …

Générer des données factices (dummy data) avec Faker Lire la suite »

Photo by Clint Adair on Unsplash

Appliquer la théorie des graphes avec NetworkX

La théorie des graphes est un aspect des mathématiques qui a beaucoup d’applications dans divers domaines. Que ce soit en biologie, en réseau informatique, en analyse de réseaux sociaux, la modélisation par la théorie des graphes s’avère très efficace. En règle générale, les problèmes qui mettent en scène des réseaux (ensemble d’ »entités » entre lesquelles il …

Appliquer la théorie des graphes avec NetworkX Lire la suite »

NER avec BERT

NER (Reconnaissance d’Entité Nommées) avec CamemBERT

Dans cet article, nous faisons une implémentation de NER avec CamemBERT (une version française de BERT). Le NER (Named Entity Recognition) ou REN (Reconnaissance d’Entité Nommées) en français est une tâche de NLP qui a pour but d’étiqueter un mot (ou groupe de mots) d’un texte, à partir un ensemble d’étiquettes prédéfinies. Exemple : But …

NER (Reconnaissance d’Entité Nommées) avec CamemBERT Lire la suite »

serie_temporelle

Série temporelle – Prévision avec ARIMA

L’une des méthodes de prévision de séries temporelles les plus répandues est la méthode ARIMA. ARIMA signifie : AutoRegressive Integrated Moving Average. Il s’agit d’un modèle qui prédit les valeurs futures d’une série temporelle sur certains aspects de la structure statistique de la série observée. Dans cet article nous verrons, de façon succincte, quel est le …

Série temporelle – Prévision avec ARIMA Lire la suite »

Projet

Top 5 de projets pour débuter en NLP

Pour décrocher votre premier boulot en NLP, il vous faudra justifier d’un minimum d’expériences. Travailler sur des projets pratiques est l’une des meilleures façons d’acquérir de l’expérience et donc des compétences dans le domaine. Dans cet article je vous présente 5 projets relativement simples par lesquels vous pouvez débuter votre apprentissage en NLP. Il s’agit …

Top 5 de projets pour débuter en NLP Lire la suite »

Génération de données

Introduction au résumé automatique de texte

Je vous propose de jeter un coup d’œil à une de mes tâches de NLP préférées : le résumé automatique (text summarization en anglais). Comme son nom l’indique, cette tâche consiste à automatiser le résumé de texte en utilisant le machine learning. Intérêt du résumé de texte automatique Avec le web aujourd’hui, on n’a jamais …

Introduction au résumé automatique de texte Lire la suite »

Séries temporelles

K-means sur des séries temporelles

J’ai récemment été amené à travailler sur un projet qui avait pour but d’étudier des données remontées par des capteurs. Il s’agissait d’un projet d’IoT et j’ai eu besoin de faire du clustering sur les valeurs remontées par les capteurs, qui sont en fait des séries temporelles. J’ai donc décidé d’appliquer un algorithme de clustering …

K-means sur des séries temporelles Lire la suite »

Déployer un modèle de machine learning

Déployer un modèle de Machine Learning avec Flask

C’est bien d’implémenter un modèle de machine learning performant. Mais ce dernier n’aura pas grand intérêt s’il ne peut être utilisé dans « une application ». En effet, après l’entraînement d’un modèle, ce dernier n’est pas tout à fait prêt à être utilisé. Il nous faut le écrire du code supplémentaire afin qu’il puisse effectivement servir. Dans …

Déployer un modèle de Machine Learning avec Flask Lire la suite »