Top 10 des livres de data science

De nos jours, on peut acquérir la connaissance de plusieurs façons soit au travers d’articles de blog, de MOOC, de vidéos YouTube,.., sans oublier les bons vieux classiques : les livres.
J’apprécie particulièrement les livres, car j’arrive à avoir une connexion assez particulière avec eux. J’ai beaucoup appris ces dernières années grâce aux livres. Il n’y a rien de tel que d’ouvrir son esprit à un monde de connaissances condensé en quelques centaines de pages. Dans cet article, je vous présenterai une liste des meilleurs livres de Data Science à ce jour. Pour ce faire, je vais me baser sur les avis des experts du domaine et bien évidemment de ma propre expérience de lecture. 

Aussi, je ne vous demande pas de lire tous ces livres, c’est ambitieux cependant ce n’est pas une stratégie efficace. Utilisez-les plutôt afin d’acquérir rapidement de nouvelles compétences. La meilleure façon d’y parvenir est de réaliser de petits projets, Simple.

Top 10 des livres de data science

1. The Elements of Statistical Learning

Auteurs : Trevor Hastie, Robert Tibshirani, and Jerome Friedman
Ce livre passe en revue un grand nombre de techniques de machine learning allant des modèles linéaires généralisés, aux “SVM”, au “boosting“, etc.
Dans ce livre les concepts sont présentés de façon plus ou moins mathématique, sans pour autant s’étaler sur les détails. Ce livre donne plutôt une idée de ce qu’une méthode (un algorithme de Machine Learning) essaie de faire. Et c’est la raison pour laquelle je l’aime tant.

Le seul hic : il vous sera difficile de cerner certains concepts si vous n’avez pas les compétences de bases en Math sup ou en statistiques.

2. Python for Data Science Handbook

Book Cover

Auteur : Jake VanderPlas

Ce livre de Jake VanderPlas est un très bon livre, il est beaucoup plus concret et pratique que le précédent. En effet, celui-ci est un guide de librairies Python standards de data science (IPython, Numpy, Pandas, Matplotlib, Scikit-Learn). Ce livre nous a été beaucoup utile pour certains articles publiés sur le blog ! Si vous voulez maitriser les bibliothèques de base de data science, ce livre est fait pour vous ! Bonus : il est disponible en open-source sur GitHub sous forme de série de Jupiter Notebook.

3. Introduction to Statistical Learning 

Amazon.fr - An Introduction to Statistical Learning: With Applications in R  - James, Gareth, Witten, Daniela, Hastie, Trevor, Tibshirani, Robert -  Livre de data science

Auteurs : Gareth James, Daniela Witten, Trevor Hastie, and Robert Tibshirani

Introduction to Statistical Learning est “LE LIVRE” pour ceux qui ne possèdent pas de solides connaissances en mathématiques (enfin, limitée). Il se positionne comme une excellente introduction à la méthodologie de l’apprentissage statistique avec R. À mon avis, il sera difficile de trouver des livres de Data Science (avec R) qui font mieux.

4. Data Science from Scratch : First Principles with Python

Amazon.fr - Data Science from Scratch: First Principles With Python - Grus,  Joel -  Livre de data science

Auteur: Joel Grus

Un autre livre de data science en python qui explique comment implémenter des algorithmes à partir de zéro (Oui zéro). Il couvre une variété de domaines, dont le deep learning, les statistiques, le NLP et bien d’autres encore.

5. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow

Amazon.fr - Hands-On Machine Learning with Scikit-Learn, Keras, and  Tensorflow: Concepts, Tools, and Techniques to Build Intelligent Systems -  Geron, Aurelien - Livre de data science

Auteur : Aurélien Géron

Ce livre est probablement l’un des plus complets en Machine Learning. Il peut convenir aux débutants ainsi qu’aux plus expérimentés. Les différents concepts théoriques en Machine Learning sont abordés et étayés par des exemples puissants. Il est certain qu’après avoir parcouru ce livre, vous serez en mesure de vous plonger plus profondément dans le Machine Learning et de résoudre des problèmes du monde réel.

6. Deep Learning

Amazon.fr - Deep Learning - Goodfellow, Ian, Bengio, Yoshua, Courville,  Aaron - Livre de data science

Auteurs : Ian Goodfellow, Yoshua Bengio and Aaron Courville

Le Deep Learning enseigné par les super stars du domaine. Si vous voulez du concret et de la pratique ce livre n’est pas fait pour vous. Par contre, si vous voulez comprendre toute la théorie qui se cache derrière le buzz word “Deep Learning”, il est parfait. Ce livre couvre la quasi-totalité des concepts en deep learning et je crois qu’il est “la référence” en deep learning.

7. The Hundred-Page Machine Learning Book

Amazon.fr - The Hundred-Page Machine Learning Book - Burkov, Andriy - Livres

Auteur : Andriy Burkov

Une centaine de pages dans lesquels tous les concepts de base en Machine Learning sont clairement présentés. Résumé : concis et précis. Un livre à avoir en version papier !

8. Introduction to Machine Learning with Python: A Guide for Data Scientists

Amazon.fr - Introduction to Machine Learning with Python - Guido, Sarah,  Mueller, Andreas - Livre de data science

Auteurs: Andreas C. Müller, Sarah Guido

Ce livre est une option idéale pour ceux qui veulent se lancer en data science. Avec des exemples illustratifs, ce livre fournit une explication claire des concepts fondamentaux de Data Science et de Machine Learning. Le meilleur de ce livre est que le lecteur n’a pas besoin de connaissances préalables en Data Science, en Machine Learning et en Python. Ce livre contient les concepts fondamentaux du ML, des techniques avancées pour l’évaluation de modèles, le concept de pipeline, …, et bien d’autres choses encore.

9. Deep Learning with Python

Amazon.fr - Deep Learning with Python - Chollet, Francois - Livre de data science

Autheur : François Chollet

François Chollet est le créateur de la célèbre librairie de Deep Learning Keras. Dans ce livre, l’auteur définit clairement les différents concepts en Deep Learning et des applications en Python. J’apprécie ce livre pour sa praticité. On a comme l’impression de suivre un tutoriel lorsqu’on le lit. Il est parfait pour ceux qui connaissent déjà le langage Python et veulent débuter le Machine Learning et le Deep Learning.

10. R for Data Science

Amazon.fr - R for Data Science - Grolemund, Garrett, Wickham, Hadley -  Livre de data science

Auteurs : Garrett Grolemund  (Auteur), Hadley Wickham  (Auteur)
C’est le livre le plus polyvalent de ce classement. Dataviz, nettoyage des données, analyses de données, programmation, modélisation et même le storytelling, tout y est. Vous ne serez pas expert avec ce livre, mais aurez acquis la bonne méthodologie afin de faire face aux différentes problématiques de base qu’on pourrait rencontrer en Data Science. Un livre complet de data science avec R.

Conclusion

Si vous voulez débuter en Data Science ou acquérir une expertise solide dans le domaine je pense que ces livres de Data Science feront l’affaire. Je vous conseille de lire les avis de ces différents livres. Puis, si possible, essayer d’obtenir une version e-book gratuite. Histoire de le tester avant de passer à l’achat.
N’hésitez pas à rajouter en commentaire d’autres livres intéressants qui ne figurent pas cet article afin de faire profiter la communauté !

4 commentaires
  1. Robert Sojic dit

    Ce qui est un peu triste, c’est qu’il n’y a aucune référence en français, alors que l’école française de la statistique n’a certainement pas à rougir de ses contributions à la science des données. Je ne suis pas suffisamment avancé pour recommander des ouvrages, mais j’imagine que cela doit pouvoir se trouver non ?

    1. Henri Michel dit

      Bonjour Robert,
      en effet, je suis d’avis avec vous cependant dans cet article, j’ai essayé de référencer les meilleurs livres de data science en ne me limitant pas par la barrière de la langue. Il y a évidemment des auteurs francophones dans cette liste…
      Je reste toute fois à l’écoute sur des références en français que je rajouterai avec joie à cet article.

      1. Antony ADOPO dit

        Ohhh, je recommande également les livres de Stéphane Tufféry notamment “Data mining et Statistique décisionnelle ” qui fournit une très bonne approche méthodologique en la matière

        1. Olivier dit

          Merci Antony, pour cette recommandation 🙂

Laisser un commentaire

Votre adresse email ne sera pas publiée.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Voulez-vous en savoir plus sur la Data Science ?

Inscrivez-vous alors à notre newsletter et vous receverez gratuitement nos derniers articles et actualités ! 
S'INSCRIRE MAINTENANT 
close-link