Chapitre 1

Introduction au Machine Learning


Davantage de données, davantage de questions, de meilleures réponses

Les algorithmes de Machine Learning trouvent des patterns naturels dans les données qui génèrent des informations aidant à prendre des décisions plus éclairées et à établir de meilleures prédictions. Ils sont utilisés au quotidien pour prendre des décisions cruciales pour le diagnostic médical, les opérations boursières, la prévision de la consommation énergétique, et plus encore. Les sites de contenus multimédias exploitent le Machine Learning pour passer au crible des millions d'options afin de proposer des recommandations de chansons ou de films. Les entreprises du commerce ont recours au Machine Learning pour mieux connaître les comportements d'achat de leurs clients.

Représentation graphique d'un bras robotisé

Industries de l'automobile et de la fabrication : maintenance prédictive

Représentation graphique de deux courbes entrecroisées, présentant des variations à la hausse et à la baisse

Finance computationnelle : credit scoring et trading algorithmique

Représentation graphique d'une tête sans visage, comportant des signes +

Traitement d'images et Computer Vision : reconnaissance faciale et détection d'objets

Représentation graphique de l'ADN

Biologie computationnelle : détection de tumeurs, découverte de médicaments et séquençage de l'ADN

Représentation graphique d'un éclair

Production d'énergie : prévision des prix et de la charge du réseau

Représentation graphique de deux bulles de dialogue

Traitement du langage naturel

Applications concrètes :

La vidéo dure 3:51

Comment fonctionne le Machine Learning

Le Machine Learning fait appel à deux types de techniques : l’apprentissage supervisé, qui entraîne un modèle sur des données d'entrée et de sortie connues afin de prédire les résultats futurs, et l’apprentissage non supervisé, qui identifie des patterns cachés ou des structures intrinsèques dans les données d'entrée.

Comment choisir l'algorithme à utiliser ?

Choisir le bon algorithme peut sembler très compliqué : il existe des dizaines d'algorithmes de Machine Learning supervisé et non supervisé, et chacun d'entre eux adopte une approche différente pour l'apprentissage. Il n'existe ni méthode idéale ni solution universelle. Déterminer le bon algorithme à utiliser est en partie une question de tâtonnement. Même les data scientists les plus expérimentés ne peuvent pas dire si un algorithme fonctionnera sans l'avoir essayé. Mais le choix de l'algorithme dépend également du volume et du type de données manipulées, des informations que vous souhaitez obtenir à partir de ces données et de la manière dont ces informations seront utilisées.

  • Machines à vecteurs de support (SVM)
  • Analyse discriminante
  • Classification naïve bayésienne
  • Méthode des plus proches voisins
  • Régression linéaire, modèle linéaire généralisé (GLM)
  • Régression à vecteurs de support (SVR), régression par processus gaussiens (GPR)
  • Méthodes ensemblistes
  • Arbres de décision
  • Réseaux de neurones
  • Clustering k-Means, clustering k-Medoids
  • Clustering c-Means flou
  • Clustering hiérarchique
  • Modèles de mélange gaussien
  • Réseaux de neurones
  • Chaînes de Markov cachées

Quand utiliser le Machine Learning ?

Le Machine Learning est une option à envisager dans le cas d’une tâche ou d’un problème complexe impliquant une grande quantité de données et de nombreuses variables, mais aucune formule ou équation existante. Le Machine Learning est par exemple une option intéressante dans les situations ci-dessous.

Quand les règles et équations manuscrites sont trop complexes, comme dans le cas de la reconnaissance faciale ou vocale

Quand la nature des données ne cesse d'évoluer et le programme doit s’adapter en permanence, comme dans le cas du trading automatisé, de la prédiction de la demande d'énergie et de la prédiction des tendances d'achat

Quand les règles d'une tâche changent constamment, comme dans le cas de la détection des fraudes à partir des enregistrements de transactions