Kapitel 4

Anwendung des überwachten Lernens


Wann ist das überwachte Lernen sinnvoll?

Ein Algorithmus zum überwachten Lernen nimmt also einen bekannten Eingabedatensatz (den Trainingssatz) und bekannte Reaktionen auf die Daten (Ausgabe) und trainiert damit ein Modell, um begründete Vorhersagen für die Reaktion auf neue Eingabedaten zu erstellen. Das überwachte Lernen wird empfohlen, wenn die Daten für die zu prognostizierende Ausgabe bekannt sind.

Alle Techniken des überwachten Lernens stellen eine Form der Klassifizierung oder Regression dar.

Dauer des Videos 4:35

Klassifizierungstechniken ermöglichen die Vorhersage diskreter Reaktionen – etwa ob eine E-Mail authentisch oder Spam ist oder ob ein Tumor klein, mittel oder groß ist. Klassifizierungsmodelle werden trainiert, um Daten in Kategorien zu klassifizieren. Zu den Anwendungsmöglichkeiten gehören beispielsweise die medizinische Bildgebung, Spracherkennung und Bonitätsprüfungen.

Regressionsverfahren sagen kontinuierliche Reaktionen voraus, z. B. Temperaturänderungen oder Schwankungen des Strombedarfs. Zu den Anwendungsmöglichkeiten gehören die Vorhersage von Aktienkursen, die Handschrifterkennung und die Verarbeitung akustischer Signale.

Auswahl des richtigen Algorithmus

Wie wir in Kapitel 1 gesehen haben, ist die Auswahl eines Machine-Learning-Algorithmus mit einer Reihe von Versuchen und Misserfolgen verbunden. Sie ist außerdem ein Kompromiss zwischen bestimmten Charakteristiken der Algorithmen, wie z. B.

  • Trainingsgeschwindigkeit
  • Speichernutzung 
  • Vorhersagegenauigkeit bei neuen Daten
  • Transparenz oder Interpretierbarkeit (wie leicht man die Gründe verstehen kann, warum ein Algorithmus seine Vorhersagen macht)

Gängige Klassifizierungsalgorithmen

Gängige Regressionsalgorithmen