Supervised Learning

Construire des modèles prédictifs à partir de données d'entrée et de réponse connues avec des techniques de Machine Learning

L'apprentissage supervisé est le type d'algorithme de Machine Learning le plus fréquent. Il utilise un jeu de données connu (appelé données d'apprentissage) afin d'entraîner un algorithme avec des données d'entrée connues (appelées caractéristiques) et des réponses connues pour réaliser des prédictions. Le jeu de données d'apprentissage comprend des données d'entrée labélisées qui sont associées aux valeurs de sortie ou de réponse souhaitées. À partir de ces données, l'algorithme d'apprentissage supervisé cherche à créer un modèle en trouvant des relations entre les caractéristiques et les données de sortie, puis il fait des prédictions sur les valeurs de réponse pour un nouveau jeu de données.

Avant de recourir à l'apprentissage supervisé, l'apprentissage non supervisé est fréquemment utilisé pour trouver des patterns dans les données d'entrée qui suggèrent des caractéristiques candidates, puis le processus d'ingénierie des caractéristiques les transforme pour les rendre plus adaptées à l'apprentissage supervisé. En plus d'identifier des caractéristiques, la réponse correcte ou la catégorie doit être identifiée pour toutes les observations dans le jeu de données d'apprentissage, une étape nécessitant beaucoup de travail. L'apprentissage semi-supervisé permet d'entraîner des modèles avec des données labélisées très limitées, ce qui permet de réduire l'effort de labélisation.

Une fois que l'algorithme est entraîné, un jeu de données test, qui n'a pas été utilisé pour l'apprentissage, est généralement utilisé pour prédire la performance de l'algorithme et le valider. Afin d'obtenir des résultats de performance précis, il est impératif que les jeux de données d'apprentissage et de test soient tous deux une bonne représentation de la « réalité » (c'est-à-dire que les données de l'environnement de production et du modèle aient été validées correctement).

Q&A sur la validation de modèle

Vous pouvez entraîner, valider et ajuster des modèles d'apprentissage supervisé prédictifs dans MATLAB® avec Deep Learning Toolbox™ et Statistics and Machine Learning Toolbox™.

Catégories d'algorithmes d'apprentissage supervisé

Classification : ces algorithmes sont utilisés pour des valeurs de réponse catégorielles, lorsque les données peuvent être séparées en classes spécifiques. Un modèle de classification est dit binaire s'il a deux classes et multiclasses s'il en a plus de deux. Vous pouvez entraîner des modèles de classification avec l'application Classification Learner avec MATLAB.

Les algorithmes de classification courants comprennent :

Régression : ces algorithmes sont utilisés pour des valeurs de réponses numériques continues. Vous pouvez entraîner des modèles de régression avec l'application Regression Learner avec MATLAB.

Les algorithmes de régression courants comprennent :

Applications d'apprentissage supervisé

L'apprentissage supervisé est utilisé dans de nombreux domaines comme la finance pour le credit scoring, le trading algorithmique et la classification des obligations, les applications images et vidéos pour la classification et le suivi d'objets, les applications industrielles pour la détection des données aberrantes, la maintenance prédictive pour l'estimation de la durée de vie des équipements, la biologie pour la détection de tumeurs et la découverte de médicaments, ainsi que dans le secteur de l'énergie pour la prévision des prix et de la charge du réseau.

Voir aussi: Statistics and Machine Learning Toolbox, Deep Learning Toolbox, Machine Learning, apprentissage non supervisé, AdaBoost, régression linéaire, régression non linéaire, ajustement des données, analyse de données, modélisation mathématique, modélisation prédictive, intelligence artificielle, Machine Learning automatisé (AutoML), régularisation, biomedical signal processing

Quel est votre niveau de connaissances en matière de Machine Learning ?