se former à l'IA cet été -weave
IA Lab

Idées de lectures sur l’IA pour un été studieux

12 juillet 2018

Les congés approchent à grands pas, vous ne savez toujours pas quoi lire et le bronzage oisif n’est pas trop votre truc ? Les marronniers consacrés aux embouteillages d’autoroutes, à l’efficacité des crèmes à la fois bronzantes et hydratantes ou au timing opportun pour acheter les fournitures scolaires pour la rentrée du petit dernier n’étanchent pas entièrement votre soif de savoir ?

Chers lecteurs assidus de la rubrique IA Lab by weave, soyez donc rassurés, le salut est à portée de main car nous avons pensé à vous. Nous vous proposons quelques lectures roboratives sur votre sujet de prédilection : l’IA !

A chacun sa quête : ceux qui cherchent à dissiper de leur esprit les ténèbres de l’ignorance trouveront leur bonheur dans la première rubrique : « Être moins ignorant ». Savoir parler avec aplomb du sujet devant vos collègues et vos clients, voilà le principal bénéfice de votre lecture ! Pour les gens d’action, qui ne conçoivent la maîtrise d’un sujet que par le savoir-faire, la section « L’IA par la pratique » devrait vous combler. Expérimenter plutôt que lire sera toutefois le prix à payer. Enfin, pour les âmes inquiètes, tourmentées par des questions comme « C’est quoi au fond le machine learning ? » ou « Que puis-je savoir ? », elles seront rassérénées par la section « Aller au fond des choses ». Après une étude âpre et solitaire, elles seules connaîtront ce bonheur ineffable qui est de comprendre vraiment.

Sachant que l’on peut parler d’IA sans en faire ni comprendre ce que l’on dit, que l’on peut en faire sans vraiment comprendre ni savoir expliquer et enfin que l’on peut comprendre sans pour autant savoir faire ni savoir expliquer, rien n’empêche d’être ambitieux et de cumuler plusieurs quêtes !

Qu’elle que soit la vôtre, partez donc en paix !

Être moins ignorant

L’introduction du rapport Villani

Publié en mars 2018, ce rapport [VIL] synthétise les résultats des travaux de la mission parlementaire que le premier ministre a confiée à Cédric Villani. Le corps du rapport traite de politique économique et sociale et sa lecture pourrait s’avérer un tantinet austère pour la plage. L’introduction (p9-p13) vaut cependant largement le détour, tant par la profondeur des vues qu’y exprime C. Villani que par la réjouissante qualité de style qu’il déploie. La forme tranche avec l’insipidité de la novlangue utilisée dans tant d’autres textes et la lucidité est celle d’un esprit rompu aux sujets ardus et capable de mettre de l’ordre dans un foisonnement confus d’idées reçues. N’est pas médaille Fields qui veut.

 

Le livre blanc weave – IA ou en sommes-nous

Publié début 2017 par weave, notre livre blanc « L’IA ou en somme nous ? » [IAW] s’attache à définir le sujet avec un objectif de démystification. Un chapitre d’introduction brosse à grands traits l’évolution d’un champ scientifique et technique par essence pluridisciplinaire, en insistant sur les facteurs à l’origine des progrès récents. Les chapitres qui suivent décrivent les problèmes encore ouverts de l’IA, les applications existantes et celles qui pourraient voir le jour bientôt. Les questions éthiques et juridiques sont également abordées. Le document est écrit dans un langage non technique et ne nécessite aucun prérequis.

 

L’IA par la pratique

Hands-On ML with Scikit-Learn & TensorfFlow

Sans hésiter l’une des meilleures sources [HOM] pour apprendre le Machine Learning par la pratique. Le moins que l’on puisse dire, c’est qu’Aurélien Géron sait de quoi il parle. Product manager chez Google, il a dirigé l’équipe de classification de vidéos YouTube. Très pédagogique et rédigé avec grand soin, l’ouvrage comprend deux parties. La première est une introduction au Machine Learning avec l’une des meilleures API ML disponibles actuellement Scikit-Learn. La seconde est consacrée au Deep Learning avec une introduction à TensorFlow. La qualité et l’originalité de cet ouvrage tiennent à l’équilibre réussi entre l’approche pratique par le code et les explications intuitives des concepts théoriques avec une remarquable économie de notations. Un livre qui devrait plaire aux profils d’ingénieurs. L’ouvrage présuppose une connaissance du langage Python et quelques rudiments de théorie des probabilités et d’algèbre linéaire.

 

Deep Learning with Python

Peut-être le meilleur ouvrage sur le Deep Learning disponible actuellement. Là encore, c’est une des têtes pensantes de l’IA qui est aux commandes. François Chollet, chercheur en IA chez Google, est le concepteur du framework Keras (utilisé dans l’ouvrage) qui vise à démocratiser la conception de modèles de Deep Learning. Je ne conseillerais pas ce livre comme premier livre sur le ML cependant, car les explications des concepts sont souvent trop succinctes pour être pleinement intelligibles par des débutants. Le livre est aussi plutôt avare de figures (pourtant bien utiles pour comprendre la notion de filtre d’un réseau de convolution p.ex.) et semble avoir été écrit dans l’urgence à partir de notebook Jupyter. Ces réserves étant émises, l’ouvrage reste remarquable à la fois par la diversité des exemples abordés, la qualité du code Python et plus encore par la perspicacité des commentaires de F. Chollet qui ne se contente pas d’être un technicien du Deep Learning, mais s’adresse au lecteur comme un vrai penseur du sujet. Le chapitre 9, où il décrit sa vision du futur de la discipline, est ce que j’ai lu de plus significatif.

Aller au fond des choses

Pattern Recognition and Machine Learning

Un vrai beau textbook sur le ML écrit d’une main de maître : Christopher Bishop directeur de Microsoft Research à Cambridge. Le livre présente le ML comme un ensemble d’applications de la théorie des probabilités et de la théorie de l’information. L’accent est mis sur le développement de modèles probabilistes dont on va chercher à évaluer les paramètres à partir d’échantillons expérimentaux avec différentes méthodes exactes (maximum de vraisemblance et ses extensions bayésiennes) ou approximatives (descente de gradient stochastique, algorithme d’extrémisation-minimisation, approches variationnelles, MCMC etc…). L’accent mis sur l’approche bayésienne sera particulièrement utile pour aborder le sujet récent du Deep Learning bayésien. Clarté de la présentation, cohérence des notations, rigueur logique et qualité des illustrations, font de cet ouvrage une référence incontournable pour qui souhaite comprendre comment fonctionnent les algorithmes implémentés dans des API de ML comme Scikit-Learn ou TensorFlow. Les seuls prérequis sont une connaissance de base de l’analyse et de l’algèbre linéaire. L’auteur adopte un style discursif précis, avec une argumentation rigoureuse, mais ne suit pas les canons d’un texte mathématique classique fait d’une succession de définitions et de preuves.

 

Understanding Machine Learning

Le titre dit tout et le contenu de l’ouvrage tient la promesse ! Voilà une merveille d’élégance et de perspicacité. Certes cet ouvrage ne sera d’aucune utilité pour gagner une compétition Kaggle mais il ravira les ceux qui recherchent une présentation mathématique à la fois rigoureuse et profonde du sujet. Le point de vue est celui de l’approche discriminante et agnostique du ML. Contrairement à l’ouvrage de Ch. Bishop, on ne cherche pas ici à optimiser des modèles probabilistes mais on étudie sous quelles conditions il est possible de construire des prédicteurs utiles sans rien connaître de la distribution de probabilité sous-jacente aux données. Élucider la relation entre la complexité (VC-dimension et complexité de Rademarcher) d’une classe d’hypothèses exploitée par un algorithme et la taille des échantillons nécessaires pour parvenir à une certaine précision, est le thème central de l’ouvrage. Les algorithmes classiques (régression linéaire Ridge, SVM, méthodes à noyaux, arbres de décision, réseau de neurones etc.) sont ici motivés comme des solutions à la recherche d’un bon compromis entre biais inductif, richesses des classes d’hypothèses et la complexité computationnelle de algorithmes.

Et bonnes vacances !

 

Illustrations par Sandy Malosse 

 

Références

Newsletter

Inscrivez-vous à notre newsletter pour recevoir nos dernières actualités*

Les informations recueillies sur ce formulaire sont enregistrées dans un fichier informatisé de gestion des Clients et Prospects (CRM).

Le Responsable de traitement est la société weave, 37 rue du rocher 75008 Paris RCS Paris 802 396 085.

Elles sont destinées à l’activité marketing du groupe weave ainsi quà celle de ses filiales, à l’exclusion de tout transfert hors de l’UE. Elles sont conservées pour une durée conforme aux dispositions légales (par exemple 3 ans pour les données prospects).

Ce traitement nécessite votre consentement que vous pourrez retirer à tout moment sans que cela ne remette en cause sa licéité.

Conformément à la loi « Informatique et Libertés » et au règlement européen n°2016/679, vous bénéficiez d’un droit d’accès, de rectification ou d’effacement, ainsi que d’un droit à la portabilité de vos données ou de limitation du traitement. Vous pouvez également pour des raisons tenant à votre situation particulière, vous opposer au traitement de vos données et donner des directives relatives à la conservation, à l’effacement et à la communication de vos données après votre décès. Vous disposez également du droit d’introduire une réclamation auprès de la Commission Nationale de l’Informatique et des Libertés (www.cnil.fr).

Vous pouvez exercer vos droits en nous contactant à l’adresse contact@weave.eu.

En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour mesurer notre audience, vous proposer des contenus et des offres personnalisées, ainsi que des fonctionnalités de partage sur les réseaux sociaux. En savoir plus sur notre politique de cookies et notre charte des données personnelles