Henri Michel

DBT (Data Build Tool) – Introduction

dbt est un outil de transformation de donnée qui permet aux équipes analytiques (Data engineer, Data analyst , Data scientist,..) de déployer du code rapidement et de manière collaborative. Dans cet article, nous allons vous présenter DBT, quelques fonctionnalités, et surtout pourquoi et quand l’utiliser ! C’est quoi DBT ? DBT (Data Build Tool) est …

DBT (Data Build Tool) – Introduction Lire la suite »

Multithreading en Python

Vous êtes-vous déjà trouvé dans une situation où vous devez attendre longtemps pendant le traitement de vos données ? Honnêtement, cela m’arrive souvent. Certains brandirons les drapeaux Spark /MapR. Cependant, dans cet article, nous allons apprendre à utiliser rien que les ressources locales (ordinateur/serveur) disponibles pour paralléliser nos calculs.Ainsi, dans cet article, nous présentons les …

Multithreading en Python Lire la suite »

dataprep

Dataprep: une librairie python pour accélérer votre analyse de données

Le processus de préparation des données commence par trouver les bonnes données. Cela peut provenir d’un catalogue de données existant ou d’un entrepôt. Une fois les données collectées, il est important de découvrir et d’explorer les données à préparer et à traiter. Cette étape est essentielle et permet de connaître les données et de comprendre …

Dataprep: une librairie python pour accélérer votre analyse de données Lire la suite »

Introduction à Kubernetes l’orchestrateur de conteneurs

De plus en plus d’applications modernes sont construites à l’aide de conteneurs, qui sont des microservices packagés avec leurs dépendances et leurs configurations. Kubernetes est un logiciel open-source qui permet de déployer et de gérer ces conteneurs à l’échelle. Dans cet article, nous présenterons Kubernetes, les motivations de cette solution (Pourquoi Kubernetes ?) , certains …

Introduction à Kubernetes l’orchestrateur de conteneurs Lire la suite »

Déployer rapidement des modèles de ML avec FastAPI

Le déploiement de modèle de Machine learning (ML) est l’une des étapes les plus importantes dans un projet de ML. Pourquoi ? La réponse est bien évidente, car déployer un modèle consiste tout simplement à rendre ce modèle disponible dans un environnement (ex. de production) où il pourra fournir des prédictions à d’autres systèmes. En …

Déployer rapidement des modèles de ML avec FastAPI Lire la suite »

Support Vector Machines (SVM) en python

Un Support Vector Machines (SVM) est un modèle de machine learning très puissant et polyvalent, capable d’effectuer une classification linéaire ou non linéaire, une régression et même une détection des outliers. C’est l’un des modèles les plus populaires de l’apprentissage automatique et toute personne intéressée par l’apprentissage automatique devrait l’avoir dans sa boîte à outils. …

Support Vector Machines (SVM) en python Lire la suite »

Top 10 des livres de data science

De nos jours, on peut acquérir la connaissance de plusieurs façons soit au travers d’articles de blog, de MOOC, de vidéos YouTube,.., sans oublier les bons vieux classiques : les livres.J’apprécie particulièrement les livres, car j’arrive à avoir une connexion assez particulière avec eux. J’ai beaucoup appris ces dernières années grâce aux livres. Il n’y …

Top 10 des livres de data science Lire la suite »

Illustration transfer learning

Introduction au Transfer Learning

Le transfer learning a vu sa cote de popularité exploser dans le domaine du machine learning. L’une des principales raisons de son succès, c’est le fait de pouvoir utiliser les connaissances obtenues en effectuant une tâche afin de résoudre un problème différent, mais qui présente des similitudes. Dans cet article, nous présenterons ce qu’est le …

Introduction au Transfer Learning Lire la suite »

data visualisation

Introduction à la data visualisation

Pouvoir visualiser ses données lorsqu’on les manipule est une nécessité. Observer des graphes nous permet d’anticiper certains problèmes et de mieux peaufiner nos futures analyses. Dans cet article introductif, nous présenterons ce qu’est la data visualisation, différents types de visualisations, quand et comment les utiliser, et les librairies python de visualisation des données les plus …

Introduction à la data visualisation Lire la suite »

Les fonctions lambda en python – quand les utiliser ?

Python et d’autres langages comme Java, C#, et même C++ ont vu des fonctions lambda ajoutées à leur syntaxe.Dans cet article, nous essayerons de comprendre les fonctions lambda en python afin de les utiliser dans les meilleures conditions. Que sont les fonctions lambda et en quoi diffèrent-elles des fonctions normales ? En Python, le mot-clé …

Les fonctions lambda en python – quand les utiliser ? Lire la suite »