Machine Learning

Machine Learning

Drei Dinge, die Sie wissen sollten

Machine Learning ist eine Datenanalysetechnik, mit der Computer eine Fähigkeit erwerben, die Menschen und Tiere von Natur aus haben: aus Erfahrung zu lernen. Machine-Learning-Algorithmen verwenden Berechnungsmethoden, um Informationen direkt aus Daten zu „lernen“, ohne eine bestimmte Gleichung als Modell zu nutzen. Mit wachsender Anzahl von Stichproben, die zum Lernen zur Verfügung stehen, steigern diese Algorithmen ihre Leistung adaptiv.

Funktionsweise von Machine Learning

Machine Learning verwendet zwei Arten von Techniken: überwachtes Lernen, mit dem ein Modell anhand bekannter Eingabe- und Ausgabedaten trainiert wird, sodass es zukünftige Ausgaben vorhersagen kann, und nicht überwachtes Lernen, mit dem verborgene Muster oder innere Strukturen in Eingabedaten gefunden werden.

Abbildung 1: Techniken des Machine Learning sind das überwachte und das nicht überwachte Lernen.

Abbildung 1: Techniken des Machine Learning sind das überwachte und das nicht überwachte Lernen.

Überwachtes Lernen

Überwachtes Machine Learning erstellt ein Modell, das Prognosen anhand von Indizien abgibt, wenn zugleich Ungewissheiten vorliegen. Ein Algorithmus des überwachten Lernens verwendet eine bekannte Menge von Eingabedaten und bekannte Ausgänge für die Daten (die Ausgabe), um damit ein Modell zu trainieren, das fundierte Vorhersagen für den Ausgang von neuen Eingabedaten erzeugt. Verwenden Sie das überwachte Lernen, wenn Sie über bekannte Daten für die Ausgaben verfügen, die Sie vorhersagen möchten.

Beim überwachten Lernen werden Klassifikations- und Regressionstechniken verwendet, um prädiktive Modelle zu entwickeln.

Klassifikationstechniken sagen diskrete Ausgänge vorher – beispielsweise, ob eine E-Mail echt oder Spam ist oder ob ein Tumor Krebs oder gutartig ist. Klassifikationsmodelle klassifizieren Eingabedaten in Kategorien. Typische Anwendungen sind die medizinische Bildgebung, die Spracherkennung und das Credit Scoring.

Verwenden Sie die Klassifikation, wenn Ihre Daten mit Schlagwörtern versehen, in Kategorien eingeteilt oder in spezifische Gruppen oder Klassen aufgeteilt werden können. Beispielsweise verwenden Anwendungen für die Handschriftenerkennung eine Klassifikation, um Buchstaben und Ziffern zu erkennen. Bei der Bildverarbeitung und bei Computer Vision werden die Techniken der nicht überwachten Mustererkennung für die Objekterkennung und Bildsegmentierung verwendet.

Regressionstechniken sagen kontinuierliche Ausgänge voraus – beispielsweise Temperaturänderungen oder Schwankungen des Energiebedarfs. Typische Anwendungen sind die Vorhersage von Stromlasten und der algorithmische Handel.

Verwenden Sie Regressionstechniken, wenn Sie mit einem Datenbereich arbeiten oder wenn der Ausgang eine reelle Zahl ist, wie eine Temperatur oder die Zeit bis zum Ausfall eines Geräts.

Lernen Sie, wie man überwachtes Machine Learning einsetzt, um ein Modell zu trainieren, das Eingaben auf Ausgaben abbildet und die Reaktion auf neue Eingaben prognostiziert.

Nicht überwachtes Lernen

Nicht überwachtes Lernen findet verborgene Muster oder innere Strukturen in Daten. Es wird verwendet, um Rückschlüsse aus Datenmengen zu ziehen, die aus Eingabedaten ohne klassifizierte Ausgänge bestehen.

Clustering ist die häufigste Technik des nicht überwachten Lernens. Es wird für explorative Datenanalysen verwendet, um verborgene Muster oder Gruppierungen in Daten zu finden. Anwendungen für die Clusteranalyse sind beispielsweise Gensequenzanalyse, Marktforschung und Objekterkennung.

Wenn beispielsweise ein Mobilfunkanbieter die Standorte für Sendemasten optimieren möchte, kann er mit Machine Learning schätzen, wie viele Cluster von Personen diese Masten verwenden werden. Ein Mobiltelefon kann zu jedem Zeitpunkt nur mit einem Sendemast kommunizieren. Daher verwendet das Team Clustering-Algorithmen, um die beste Platzierung von Sendemasten zu finden, mit der der Signalempfang für Gruppen (oder Cluster) der Kunden optimiert wird.

Abbildung 2: Clustering findet verborgene Muster in Ihren Daten.

Abbildung 2: Clustering findet verborgene Muster in Ihren Daten.

Erfahren Sie mehr über nicht überwachtes Machine Learning, das nach Mustern in Datensätzen ohne gekennzeichnete Antworten sucht. Mit diesem Ansatz können Sie Ihre Daten untersuchen, wenn Sie sich unsicher sind, welche Informationen die Daten enthalten.

Auswahl des zu verwendenden Machine-Learning-Algorithmus

Die Auswahl des richtigen Algorithmus kann sehr schwierig erscheinen, denn es gibt Dutzende überwachter und nicht überwachter Machine-Learning-Algorithmen, und jeder verwendet einen anderen Lernansatz.

Es gibt keine beste Methode und keine, die immer geeignet ist. Die Auswahl des richtigen Algorithmus besteht zum Teil einfach aus Versuch und Irrtum – auch sehr erfahrene Datenwissenschaftler können nicht wissen, ob ein Algorithmus geeignet ist, ohne es ausprobiert zu haben. Die Auswahl eines Algorithmus hängt jedoch auch von Umfang und Art der Daten ab, mit denen Sie arbeiten, von den Einblicken, die Sie aus den Daten ziehen möchten, und von der geplanten Verwendung dieser Einblicke.

Figure 3. Machine learning techniques.

Abbildung 3: Machine-Learning–Techniken.

Es folgen einige Richtlinien für die Auswahl zwischen überwachtem und nicht überwachtem Machine Learning:

  • Wählen Sie überwachtes Lernen aus, wenn Sie ein Modell trainieren möchten, damit es eine Prognose abgibt – beispielsweise den zukünftigen Wert einer kontinuierlichen Variablen, wie eine Temperatur oder einen Aktienkurs –, oder eine Klassifikation – beispielsweise die Identifizierung von Automarken im Videomaterial einer Webcam.
  • Wählen Sie nicht überwachtes Lernen aus, wenn Sie Ihre Daten untersuchen und ein Modell trainieren möchten, damit es eine gute interne Darstellung findet, etwa indem es Daten in Cluster aufteilt.

Wichtigkeit von Machine Learning

Mit dem Aufstieg von Big Data ist Machine Learning zu einer wichtigen Technik für das Lösen von Problemen in Bereichen wie den folgenden geworden:

automotive

Automobilindustrie

aerospace

Luftfahrt, Raumfahrt und Verteidigung

medical devices

Industrieautomatisierung und Maschinenbau

metals, materials, and mining

Medizinische Geräte

signal processing

Signalverarbeitung

Mehr Daten, mehr Fragen, bessere Antworten

Machine-Learning-Algorithmen finden natürliche Muster in Daten, die Einblicke bieten und Ihnen helfen, zu besseren Entscheidungen und Prognosen zu gelangen. Sie werden täglich verwendet, um wichtige Entscheidungen bei medizinischen Diagnosen, im Börsenhandel, bei der Vorhersage von Stromlasten usw. zu treffen. Beispielsweise nutzen Medienwebsites Machine Learning, um Millionen von Optionen durchzusehen und Ihnen passende Songs oder Filme zu empfehlen. Einzelhändler verwenden es, um Einblicke in das Kaufverhalten ihrer Kunden zu gewinnen.

Warum sollten Sie Machine Learning verwenden?

Ziehen Sie die Verwendung von Machine Learning in Betracht, wenn Sie eine komplexe Aufgabe lösen möchten, die viele Daten und viele Variablen enthält, aber für die keine Formel oder Gleichung vorhanden ist. 

What's the Difference Between Machine Learning and Deep Learning?

Deep learning is a specialized form of machine learning. A machine learning workflow starts with relevant features being manually extracted from images. The features are then used to create a model that categorizes the objects in the image. With a deep learning workflow, relevant features are automatically extracted from images. In addition, deep learning performs “end-to-end learning” – where a network is given raw data and a task to perform, such as classification, and it learns how to do this automatically.

Figure 4. Comparing approaches to categorizing vehicles using machine learning (left) and deep learning (right).

In machine learning, you manually choose features and a classifier to sort images. With deep learning, feature extraction and modeling steps are automatic.

Choosing Between Machine Learning and Deep Learning

Machine learning offers a variety of techniques and models you can choose based on your application, the size of data you're processing, and the type of problem you want to solve. A successful deep learning application requires a very large amount of data (thousands of images) to train the model, as well as GPUs, or graphics processing units, to rapidly process your data.

When choosing between machine learning and deep learning, consider whether you have a high-performance GPU and lots of labeled data. If you don’t have either of those things, it may make more sense to use machine learning instead of deep learning. Deep learning is generally more complex, so you’ll need at least a few thousand images to get reliable results.

If you choose machine learning, you have the option to train your model on many different classifiers. You may also know which features to extract that will produce the best results. Plus, you also have the flexibility to choose a combination of approaches, use different classifiers and features to see which arrangement works best for your data.

Mehr über den Unterschied zwischen Machine Learning und Deep Learning erfahren Sie in diesem MATLAB Tech Talk. Lassen Sie sich anhand einiger Beispiele erklären, wie Sie sich für die geeignete Methode entscheiden.

Machine Learning mit MATLAB

Wie können Sie das Potenzial von Machine Learning nutzen, um anhand von Daten bessere Entscheidungen treffen zu können? Mit MATLAB ist Machine Learning ganz leicht. MATLAB bietet Tools und Funktionen für den Umgang mit Big Data sowie Apps, mit denen Machine Learning leicht nutzbar ist, und ist daher eine ideale Umgebung für die Anwendung von Machine Learning auf Ihre Datenanalysen.

Mit MATLAB haben Ingenieure und Datenwissenschaftler sofortigen Zugang zu vorgefertigten Funktionen, umfangreichen Toolboxen und speziellen Apps für KlassifikationRegression und Clustering.

MATLAB ermöglicht Ihnen:

  • Vergleiche von Ansätzen wie logistischer Regression, Klassifikationsbäumen, Support Vector Machines, Ensemble-Verfahren und Deep Learning.
  • Verwendung von Verfeinerungs- und Reduktionstechniken, um ein genaues Modell zu erstellen, das Ihre Daten optimal zu Vorhersagen nutzt
  • Integration von Machine-Learning-Modellen in Unternehmenssysteme, Cluster und Clouds und Nutzung von Modellen auf Echtzeit-Embedded-Zielhardware
  • Durchführung automatischer Codegenerierung für Analysen von Embedded-Sensoren
  • Unterstützung integrierter Workflows von den Datenanalysen bis zur Bereitstellung

Ähnliche Themen

Erste Schritte mit MATLAB

MATLAB für Machine Learning

Learn about MATLAB support for machine learning. 

Tutorials und Beispiele

Get started with MATLAB for machine learning.