formation en data science

Top 5 des formations en Data Science en ligne (2020)

[Mise à jour 2020] top formation de data science en ligne.
Mise à jour du top 5 des formations de data science en ligne, ajouts d’une liste exhaustive de formations assez intéressantes et l’ajout de la section coup de cœur de la rédaction.

Il y a quelques années déjà, IBM prévoyait que la demande en matière de Data Scientist  augmentera de 28% en 2020. En effet, bon nombre d’entreprises ont compris l’importance stratégique de l’exploitation de la donnée.  La data science étant au cœur de la chaîne d’exploitation de la donnée, explique la hausse de la demande des profils dans ce domaine.

 Ainsi les profils recherchés ne sont pas uniquement ceux qui suivent une voie académique normale (Diplôme universitaire, Diplôme d’école d’ingénieur, …) mais aussi ceux qui ont eu à suivre une formation en Data science en ligne. Notre classement des meilleurs formations de data science en ligne prends en compte 3 grands critères. En effet, nous avons pris en compte l’approche théorique (mathématiques, statistiques, les fondamentaux du machine learning, …), Le volet informatique et surtout l’approche business (eh oui ! Il faut savoir que le but de l’analyse de données est de répondre aux problématiques métiers). D’autres critères ont été pris en compte comme la note moyenne des formations (supérieure ou égale à 4.5/5), la notoriété des encadrants, …

Top 5 des formations de data science en ligne

1. Spécialisation Data Science – Coursera

Plateforme: Coursera
Auteur: Johns Hopkins University
Durée: environ 8 Mois (5h/semaine)

Cette formation en data science en ligne offerte sur Coursera par l’université Johns Hopkins ne nécessite aucune connaissance particulière. Cette spécialisation se présente sous la forme de 10 cours de 1h à 4h de travail par semaine. Dans ce cours vous allez apprendre à connaître la boite à outils d’un Data scientist, à programmer en R, à comprendre les statistiques, Créer des modèles de régression, faire du machine learning. Toutes ces compétences pourront être mises directement en pratique sur des projets à chaque cours.

Le plan de la formation

  • Les outils du data scientist (version control, markdown, git, GitHub, R, and RStudio)
  • La programmation en R
  • Récupération et nettoyage des données
  • Exploration des données
  • Recherche reproductible
  • Inférence statistique
  • Modèles de régression
  • Machine Learning
  • Développement de “data product”
  • Projet final 

2. Professional Certificate in Data Science-(HavardX / EdX)

Plateforme: EdX
Auteur: Harvard University (HarvardX)
Durée: environ 9 Mois (2-4h/semaine)

Dans cette formation de 9 cours vous apprendrez : Les connaissances fondamentales en programmation R , les concepts statistiques tels que la probabilité, l’inférence et la modélisation et comment les mettre en pratique.Vous allez acquérir de l’expérience sur la visualisation de données avec ggplot2 et la gestion de données avec dplyr.

Vous apprendrez aussi à implémenter des algorithmes de machine learning. Les outils essentiels du domaine tels que Unix / Linux, git et GitHub et RStudio n’auront plus de secret.

Le plan de la formation :

  • Les bases de la programmation en R
  • Visualisation
  • Probabilité
  • Inférence et modélisation
  • Les outils 
  • Traitement des données
  • Régression linéaire
  • Machine learning
  • Projet Final

3. Data Scientist avec Python-DataCamp

Plateforme: DataCamp

Auteur: DataCamp

Durée: environ 5 Mois (4h/semaine)

L’une des plus complètes à mon avis. Cette formation en data science en ligne de 22 cours  d’environ 4h par cours vous aidera surement à avoir les bases solides d’un Data Scientist.

D’abord vous commencerez par apprendre à programmer en python. Ensuite vous découvrirez très rapidement la boîte à outils d’un data scientist et apprendre à manipuler des données (data frames) avec des librairies tels Pandas. Après il y a des cours sur les bases de données SQL, la visualisation avec Bokeh, les statistiques, le machine learning et le deep learning…

Le plan de la formation :

  • Introduction à la programmation Python
  • Python niveau intermédiaire
  • Projet 1
  • Manipulation des données avec Pandas
  • Projet 2
  • Fusionner des DataFrames avec Pandas
  • Projet 3
  • Intro à la visualisation des données avec Matplotlib
  • Intro à la visualisation des données avec Seaborn
  • Boîte à outils data science python part 1
  • Boîte à outils data science python part 2
  • Visualisation des données avec Seaborn (Niveau intermédiaire)
  • projet 4
  • Introduction à l’import des données avec Python
  • Import des données avec Python (Niveau intermédiaire)
  • Nettoyage des données en Python
  • Les Dates et le temps en Python
  • Les fonctions en python
  • L’analyse de données en Python
  • Projet d’analyse de données en python
  • Raisonnement statistique
  • projet 5
  • Apprentissage supervisé avec scikit-learn
  • projet 6
  • Apprentissage non-supervisé
  • ML tree-based models
  • projet 7
  • Clustering

 

4. Applied Data Science with Python Specialization- Coursera

Plateforme: Coursera
Auteur: University of Michigan
Durée: environ 5 Mois (6h/semaine)

Cette formation en data science en ligne est particulièrement destinée aux personnes qui ont de solides bases en programmation python. Dans cette formation vous pourrez apprendre les statistiques, le machine learning, l’analyse de texte et l’analyse des réseaux sociaux. Vous découvrirez bien évidement les librairies python les plus populaires tels pandas, matplotlib, scikit-learn, nltk, et networkx.

Plan de la formation :

  • Introduction à la data science avec Python
  • Plotting , Charting et représentation des données avec python
  • Machine Learning
  • Text Mining
  • Analyse des réseaux sociaux

 

5. MicroMasters Program in Statistics and Data Science (EdX)

Plateforme: EdX
Auteur: Massachusetts Institute of Technology (MITx)
Durée: environ 1 an 02 Mois (10-14h/semaine)

Des probabilités et statistiques à l’analyse des données et à l’apprentissage automatique, vous allez maîtriser les compétences nécessaires pour résoudre des problèmes complexes avec des données. Cette formation est vraiment destinée à des personnes qui ont de solides bases en algèbre linéaire et en programmation python.

Plan de la formation :

  • Probabilité
  • Analyse des données en Science Sociale
  • Les fondamentaux des statistiques
  • Machine learning avec Python – des modèles linéaires au Deep Learning
  • Examen final (Statistiques et Data science)

Bien que les formations citées plus haut soient assez intéressantes, nous avons ajouté une section “coup de cœur de la rédaction”. L’idée est de présenter des formations que nous trouvons complètes, originales, pratiques et  qui, en plus, est en français ? 🙃

❤️ Coup de cœur de la rédaction

Nous vous présentons DataScientest.com. Il s’agit d’une plateforme de formation sur des parcours Data Scientist, Data Engineer et Data Analyst. La formation se fait soit en format bootcamp ou en continu. Les formations sur le DataScientest sont assez complètes sur chacun de leurs trois parcours. En effet, en plus de couvrir, de façon quasi exhaustive, les aspects techniques de chaque métier de la Data, les formations mettent aussi un accent sur les soft skills tels que les communications orale et écrite qui sont essentiels dans le monde professionnel. Je vous conseille de faire un tour sur leur site  😉. 

 

D’autres cours et formations à suivre

CS109 Data Science — Harvard

Bien que la plateforme ne soit pas assez intuitive comme edX ou Coursera, cette formation de Data science dispensée par Harvard est très intéressante (bon équilibre théorie/pratique). Je recommande ! (Attention pas de certifs)

Deep Learning Specialization — Coursera

Crée par le Célèbre Andrew Ng ce cours vous permettra d’avoir de solides bases (voire être bon) en Deep Learning.

Advanced Machine Learning Specialization — Coursera

Cette formation est dispensée par les meilleurs Kagglers et les chercheurs du CERN. Ils font un partage d’expérience sur les différentes approches pour résoudre les problèmes de la vie courante grâce au Machine Learning.

Mathematics for Machine Learning — Coursera

Question d’avoir de solides bases en mathématiques afin d’attaquer sereinement les différentes problématiques en ML.

Petit Conseil

La Data science est un domaine en plein boom, qui demande de nombreuses compétences (pas que fit(), predict()… 🙃) et change assez rapidement. Je vous conseille d’apprendre autant que vous pouvez et d’explorer d’autres sources de connaissance (blog, Vidéos YouTube, …)  

Si vous avez des questions ou des suggestions, n’hésitez pas à les laisser dans les commentaires ci-dessous.

11 réflexions sur “Top 5 des formations en Data Science en ligne (2020)”

    1. Bonjour, vous pensez quoi du parcours data science OpenClassroom, je souhaite me reconvertir professionnellement (j’ai une licence en genie mécanique) et ce parcours ENORMEMENT

  1. Hello 🙂
    Je cherche à me reconvertir professionnellement, ces formations sont elles accessibles à des débutants ?
    Merci d’avance 😉

    1. Salut,
      les 5 formations sont accessibles à des débutants cependant il faudrait avoir les connaissances minimales en Math sup.

  2. Bonjour,
    Je suis actuellement en reconversion vers ce domaine, à la recherche de formations adaptées. J’ai à la base un diplome d’ingénieur en géologie.
    Que pensez vous de la formation data science de OpenClassRoom en partenariat avec supelec ? Est-elle du même niveau que celles citées dans cet article ? Et quid du bootcamp du Wagon ? cela vaut-il le coup d’investir dans ce genre de formation ?
    Merci d’avance !

    1. Bonjour Helene,

      Les deux formations que vous avez citées m’ont l’air très bien. Seulement, il faudra avoir quelques bases en informatique (scripting) en plus de celles maths (que je suis sûr que vous avez).
      En plus, elles ont l’avantage d’être en français (on publiera un classement de formations en français bientôt).

      Oui, cela vaut le coup si vous sentez que vous avez besoin d’assistance dans votre apprentissage. Cependant, il y a de très bons moyens de se former avec des ressources gratuites (ou du moins très peu coûteuses) mais de façon autonome.

  3. Bonjour, je viens du domaine médical, mais mes bases en mathématiques et probabilité-statistiques ont diminué avec le temps. Y a-t-il, dans ces formations, une approche qui facilite la compréhension des mathématiques avancées (je suis sûr que ma mémoire va aimer replonger dans certains domaines, mais j’étais en maths 6h, pas 8h comme les ingénieurs) ? Ou il vaut mieux commencer par relire un manuel de maths avancées ?

    1. Bonjour Eugène,
      Les formations ci-dessus requièrent des compétences de bases en Math Sup (Proba-stat, algèbre linéaire,…). Je ne pense pas que vous ayez besoin de relire un manuel de maths en entier. Par contre, je vous propose un excellent livre que vous pourrez parcourir lorsque certaines notions pourraient être floues (Essential Math for Data Science: Take Control of Your Data With Fundamental Calculus, Linear Algebra, Probability, and Statistics).
      Cdt
      Henri

  4. bonjour je suis élève ingénieure Topographe j’aimerais approfondis ma connaissance en Machine Learning.
    j’aimerais avoir toutes les infos nécessaires.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.