Einführung in Predictive Analytics - MATLAB & Simulink

Predictive Analytics

Predictive Analytics

Drei Dinge, die Sie wissen sollten

Predictive Analytics verwendet historische Daten, um zukünftige Ereignisse vorherzusagen. Im Allgemeinen werden historische Daten verwendet, um ein mathematisches Modell zu erstellen, das wichtige Trends erfasst. Dieses prädiktive Modell wird dann auf aktuelle Daten angewendet, um vorherzusagen, was als Nächstes passieren wird, oder um Aktionen vorzuschlagen, mit denen optimale Ergebnisse erreicht werden können.

Predictive Analytics hat in den letzten Jahren viel Aufmerksamkeit erhalten, da bei unterstützenden Technologien große Fortschritte zu verzeichnen waren, vor allem in den Bereichen von Big Data und Machine Learning.

Wichtigkeit Predictive Analytics

Der Aufstieg von Big Data

Predictive Analytics wird häufig im Kontext von Big Data diskutiert. Beispielsweise stammen technische Daten von Sensoren, Messinstrumenten und vernetzten Systemen in der Praxis. Zu den Daten von Business-Systemen eines Unternehmens können beispielsweise Transaktionsdaten, Vertriebsergebnisse, Kundenbeschwerden und Marketing-Informationen gehören. Unternehmen treffen zunehmend datengestützte Entscheidungen auf der Grundlage dieses wertvollen Informationen.

Zunehmender Wettbewerb

Wenn der Wettbewerb zunimmt, bemühen sich Unternehmen, ihre Produkte und Services für die umkämpften Märkte besonders hervorzuheben. Datengestützte prädiktive Modelle können Unternehmen helfen, seit Langem bestehende Probleme auf neue Weisen zu lösen.

Beispielsweise können Gerätehersteller feststellen, dass es schwierig ist, nur bei der Hardware innovativ zu sein. Produktentwickler können vorhandenen Lösungen prädiktive Funktionen hinzufügen, um den Kundennutzen zu erhöhen. Mit Predictive Analytics für die Instandhaltung von Geräten, oder vorausschauende Instandhaltung, können Geräteausfälle und Energiebedarf vorhergesagt sowie Betriebskosten gesenkt werden. Beispielsweise können Sensoren, die Vibrationen in Fahrzeugteilen messen, einen Instandhaltungsbedarf signalisieren, bevor das Fahrzeug im Straßenverkehr eine Panne hat.

Außerdem verwenden Unternehmen Predictive Analytics, um genauere Vorhersagen zu erzeugen, etwa für Energiebedarf im Stromnetz. Mit diesen Vorhersagen ist eine effektivere Ressourcenplanung möglich (beispielsweise eine Zeitplanung für den Einsatz mehrerer Kraftwerke).

Innovative Technologien für Big Data und Machine Learning

Um Big Data nutzbringend einzusetzen, wenden Unternehmen Algorithmen mithilfe von Tools wie Hadoop und Spark auf große Datenmengen an. Bei den Datenquellen kann es sich um transaktionale Datenbanken, Protokolldateien von Geräten, Bilder, Video-, Audio-, Sensor-Daten oder sonstige Datentypen handeln. Innovationen entstehen häufig durch Kombination von Daten aus mehreren Quellen.

Bei all diesen Daten sind Tools erforderlich, um Einblicke und Trends zu extrahieren. Machine-Learning-Techniken werden verwendet, um Muster in Daten zu finden und Modelle zu erstellen, die zukünftige Ergebnisse vorhersagen. Eine Reihe von Machine-Learning-Algorithmen stehen zur Verfügung, darunter die lineare und die nicht lineare Regression, neuronale Netze, Support Vector Machines, Entscheidungsbäume und andere Algorithmen.

Predictive Analytics Beispiele

Predictive Analytics ist nützlich für Teams in so unterschiedlichen Branchen wie Finanzen, Gesundheitswesen, Pharmazie, Automobilbranche, Luft- und/Raumfahrt und Fertigung.

  • Automobilbranche – Innovationen mit autonomen Fahrzeugen
    Unternehmen, die Fahrerassistenztechnologien und neue autonome Fahrzeuge entwickeln, verwenden Predictive Analytics, um Sensordaten von vernetzten Fahrzeugen zu analysieren und Fahrerassistenz-Algorithmen zu erstellen.
  • Luft- und/Raumfahrt – Zustandsüberwachung für Flugzeugtriebwerke
    Um die Betriebszeit von Flugzeugen zu verbessern und Wartungskosten zu verringern, hat ein Triebwerkshersteller eine Echtzeit-Analyseanwendung erstellt, die die Leistung der Teilsysteme für Öl, Treibstoff, Flugzeugstart, mechanischen Zustand und Steuerung vorhersagt.
  • Energieproduktion – Vorhersage von Strompreis und -bedarf
    Fortschrittliche Vorhersage-Apps verwenden Modelle, die die Verfügbarkeit von Kraftwerken, historische Trends, Jahreszeitenabhängigkeiten und das Wetter überwachen.
  • Finanzdienstleistungen – Entwicklung von Kreditrisikomodellen
    Finanzinstitute verwenden Machine-Learning-Techniken und quantitative Tools, um Kreditrisiken vorherzusagen.
  • Automatisierung und Maschinenbau – Vorhersage von Maschinenausfällen
    Ein Kunststoff- und Folienhersteller spart monatlich 50.000 Euro mit einer Anwendung für die Zustandsüberwachung und vorausschauende Instandhaltung, die Ausfallzeiten reduziert und Verschwendung minimiert.
  • Medizinprodukte – Verwendung von Mustererkennungsalgorithmen zur Erkennung von Asthma und COPD
    Ein Asthma-Management-Gerät zeichnet die Atemgeräusche von Patienten auf, analysiert sie und bietet sofortiges Feedback über eine Smartphone-App, um den Patienten den Umgang mit Asthma und COPD zu erleichtern.
Predictive Analytics Applications

Funktionsweise Predictive Analytics

Predictive Analytics ist ein Verfahren, in dem Datenanalysen verwendet werden, um Vorhersagen anhand von Daten zu treffen. Dieser Prozess verwendet Daten zusammen mit Analysen, Statistiken und Machine Learning-Techniken, um ein prädiktives Modell für die Vorhersage zukünftiger Ereignisse zu erstellen.

Der Begriff „Predictive Analytics“ beschreibt die Anwendung einer Statistik- oder Machine-Learning-Technik zur Erstellung einer quantitativen Zukunftsvorhersage. Häufig werden Techniken des überwachten Machine Learning verwendet, um einen zukünftigen Wert vorherzusagen (Wie lange kann dieses Gerät genutzt werden, bevor es eine Wartung benötigt?) oder eine Wahrscheinlichkeit zu schätzen (Wie wahrscheinlich ist es, dass dieser Kunde einen Kredit nicht zurückzahlt?).

Predictive Analytics beginnt mit einem Geschäftsziel: Daten sollen verwendet werden, um Verschwendung zu reduzieren, Zeit zu sparen oder Kosten zu senken. Der Prozess bindet heterogene, häufig sehr große Datenmengen in Modelle ein, die klare, handlungsrelevante Ergebnisse erzeugen könne, um die Erreichung dieses Ziels zu unterstützen, wie z. B. weniger Materialverschwendung, weniger Lagerbestand und ein hergestelltes Produkt, das die Spezifikationen erfüllt.

Predictive Analytics Workflow

Wir alle kennen prädiktive Modelle für die Wettervorhersage. Eine wichtige Anwendung prädiktiver Modelle in der Industrie dient der Vorhersage der Stromlasten, mit der die Nachfrage nach Energie vorhergesagt wird. In diesem Fall benötigen Energieerzeuger, Netzbetreiber und Händler genaue Vorhersagen der Stromlasten, um Entscheidungen zur Verwaltung von Lasten im Stromnetz zu treffen. Riesige Datenmengen stehen zur Verfügung, und mit prädiktiven Analysen können Netzbetreiber diese Informationen in handlungsrelevante Einblicke verwandeln.

Der Predictive-Analytics-Workflow umfasst die Bewertung und Erkundung von Daten, die Vorverarbeitung von Daten, die Entwicklung prädiktiver Modelle und die Integration von Analytik und Systemen.

Abbildung 1: Workflow der prädiktiven Analyse.

Schritt-für-Schritt-Workflow für die Vorhersage von Stromlasten

Im Allgemeinen folgt der Workflow für eine Anwendung der prädiktiven Analyse diesen grundlegenden Schritten:

  1. Importieren von Daten aus verschiedenen Datenquellen wie beispielsweise Webarchiven, Datenbanken und Kalkulationstabellen:
    Datenquellen sind beispielsweise Stromlastdaten in einer CSV-Datei und nationale Wetterdaten einschließlich Temperatur und Taupunkt.
  2. Bereinigung der Daten durch Entfernen von Ausreißern und Kombinieren von Datenquellen:
    Identifizieren Sie Datenspitzen, fehlende Daten oder anomale Punkte, die aus den Daten entfernt werden sollen. Aggregieren Sie dann unterschiedliche Datenquellen miteinander – in diesem Fall zu einer einzelnen Tabelle mit Stromlast, Temperatur und Taupunkt.
  3. Entwickeln eines genauen prädiktiven Modells auf Grundlage der aggregierten Daten unter Verwendung von Statistikinstrumenten, Werkzeugen zur Kurvenanpassung oder Machine Learning:
    Energievorhersagen sind ein komplexer Prozess mit vielen Variablen. Sie können sich also dafür entscheiden, mit neuronalen Netzen ein prädiktives Modell zu erstellen und zu trainieren. Nutzen Sie nacheinander unterschiedliche Ansätze für Ihre Datenmenge. Nach Abschluss des Trainings können Sie das Modell mit neuen Daten testen, um zu sehen, wie gut es funktioniert.
  4. Integrieren des Modells in ein Lastvorhersagesystem in einer Produktionsumgebung:
    Wenn Sie ein Modell finden, das die Last genau vorhersagt, können Sie es in Ihr Produktionssystem übernehmen und damit die Analysen für Softwareprogramme oder Geräte verfügbar machen, wie Webanwendungen, Server oder mobile Geräte.
Predictive analytics application for energy load forecasting in New York State.

Abbildung 2: Anwendung prädiktiver Analysen für die Vorhersage der Stromlasten im Bundesstaat New York.

Entwickeln prädiktiver Modelle

Ihre aggregierten Daten erzählen eine komplexe Geschichte. Um ihr Potenzial für Einblicke zu nutzen, benötigen Sie ein genaues prädiktives Modell.

Prädiktive Modellierung verwendet Methoden der Mathematik und der Informatik, um ein Ereignis oder Ergebnis vorherzusagen. Diese Modelle sagen anhand von Veränderungen an den Modelleingaben ein Ergebnis in einem zukünftigen Zustand oder zu einem zukünftigen Zeitpunkt voraus. Sie entwickeln das Modell in einem iterativen Prozess mit einer Trainings-Datenmenge und testen und prüfen es dann, um die Genauigkeit seiner Vorhersagen zu ermitteln. Sie können unterschiedliche Machine-Learning-Ansätze ausprobieren, um das effektivste Modell zu finden.

Beispiele sind Modelle mit Zeitreihen-Regression zur Vorhersage von Verkehrsaufkommen einer Fluggesellschaft oder die Vorhersage der Kraftstoffeffizienz mit einem linearen Regressionsmodell für Motordrehzahl gegenüber Last.

Predictive Analytics im Vergleich zu Prescriptive Analytics

Organisationen, die Predictive Analytics erfolgreich implementiert haben, sehen Prescriptive Analytics als ihr nächstes Ziel. Prescriptive Analytics erstellt eine Schätzung dafür, was als Nächstes passieren wird; präskriptive Analysen sagen Ihnen, wie Sie auf die Vorhersage am besten reagieren.

Prescriptive Analytics ist ein Zweig der Datenanalysen, der prädiktive Modelle verwendet, um Aktionen vorzuschlagen, die im Interesse optimaler Ergebnisse durchgeführt werden sollten. Präskriptive Analysen beruhen auf Optimierung und regelbasierten Entscheidungsfindungstechniken. Lastvorhersagen für das Stromnetz in den nächsten 24 Stunden sind ein Beispiel für Predictive Analytics. Hierauf basierende Entscheidungen dazu, wie Kraftwerke betrieben werden sollen, stellen hingegen Presctiptive Analytics dar.

Interessante Beispiele für Predictive Analytics mit MATLAB

Unternehmen finden innovative Möglichkeiten, Predictive Analytics mit MATLAB® anzuwenden, um neue Produkte und Services zu erstellen und um seit Langem bestehende Probleme auf neue Weisen zu lösen.

Die folgenden Beispiele zeigen Predictive Analytics im Einsatz:

Test Baker Hughes Develops Predictive Maintenance Software for Gas and Oil Extraction Equipment Using Data Analytics and Machine Learning

Fahrzeuge von Baker Hughes sind mit Druckpumpen ausgerüstet, die eine Mischung aus Wasser und Sand tief in gebohrte Brunnen einspeisen. Da die Pumpen einen Anteil von ca. 100.000 USD der Gesamtkosten von 1,5 Mio. USD für ein Fahrzeug ausmachen, suchte Baker Hughes nach einer Möglichkeit, bevorstehende Pumpenausfälle zu ermitteln. Das Unternehmen verarbeitete und analysierte bis zu ein Terabyte Daten. Diese wurden mit einer Rate von 50.000 Abtastungen pro Sekunde von Sensoren erfasst, die auf 10 Fahrzeugen im Einsatz montiert waren. Sie wurden verwendet, um ein neuronales Netz zu trainieren, sodass es mit Sensordaten Pumpenausfälle vorhersagen konnte. Es wird erwartet, dass die Software die Wartungskosten um 30 bis 40 % senken wird, also über 10 Mio. USD.

MATLAB customer Baker Hughes used predictive analytics and machine learning to develop predictive maintenance software.

BuildingIQ Develops Proactive Algorithms for HVAC Energy Optimization in Large-Scale Buildings

Heizungs-, Lüftungs-, Klimaanlagensysteme (HLK) in Bürogebäuden, Krankenhäusern und anderen großen Gewerbebauten sind oft ineffizient, da Wetterveränderungen, schwankende Energiekosten oder die thermischen Eigenschaften des Gebäudes nicht berücksichtigt werden. Die cloud-basierte Softwareplattform von BuildingIQ verwendet fortschrittliche Algorithmen, die ununterbrochen Gigabytes an Informationen von Stromzählern, Thermometern und HLK-Drucksensoren verarbeiten. Machine Learning wird verwendet, um die Daten zu segmentieren und den relativen Beitrag von Gas, elektrischem Strom, Dampf- und Solarenergie zu Aufheiz- und Abkühlprozessen zu ermitteln. Optimierung wird verwendet, um den besten Zeitplan für das Heizen und Kühlen jedes Gebäudes im Tagesverlauf zu ermitteln. Die Plattform von BuildingIQ verringert bei Normalbetrieb den HLK-Energieverbrauch in großen Gewerbebauten um 10 bis 25 %.

MATLAB customer BuildingIQ used predictive analytics for HVAC energy optimization in large-scale buildings.

Developing Detection Algorithms to Reduce False Alarms in Intensive Care Units

Fehlalarme von Elektrokardiographen und anderen Patientenüberwachungsgeräten stellen ein schwerwiegendes Problem auf Intensivstationen dar. Geräusche von Fehlalarmen stören den Schlaf der Patienten, und häufige Fehlalarme führen dazu, dass das Pflegepersonal echte Warnungen weniger aufmerksam wahrnimmt. Die Teilnehmer der entsprechenden „PhysioNet/Computing in Cardiology Challenge“ erhielten die Aufgabe, Algorithmen zu entwickeln, die zwischen echten Alarmen und Fehlalarmen in Signalen unterscheiden konnten, die von Überwachungsgeräten auf Intensivstationen aufgezeichnet worden waren. Forscher von der Czech Academy of Sciences erhielten den ersten Preis in der Kategorie „Echtzeit“ der Challenge. Ihre Einreichung waren MATLAB-Algorithmen, die QRS-Komplexe erkennen, zwischen normalen und ventrikulären Herzschlägen unterscheiden sowie falsche QRS-Komplexe herausfiltern können, die durch Stimuli von Herzschrittmachern entstehen. Die Algorithmen erreichten eine Richtig-positiv-Rate von 92 % und eine Richtig-negativ-Rate von 88 %.

Predictive analytics was used to develop detection algorithms to reduce false alarms in ICUs.

Predictive Analytics mit MATLAB

MATLAB wird zunehmend von Teams verwendet, die Anwendungen für Predictive Analytics entwickeln, um geschäftliche und technische Daten als Grundlage für fundierte Entscheidungen zu nutzen.

Mithilfe der Tools und Funktionen von MATLAB können Sie Predictive Analytics anhand von technischen, wissenschaftlichen und geschäftlichen Daten sowie Transaktions- und Felddaten durchführen. Mit MATLAB können Sie prädiktive Anwendungen auf großen Produktionssystemen und Embedded Systems bereitstellen.

Was spricht für MATLAB für Predictive Analytics?

Abbildung 3: MATLAB für Predictive Analytics.

Wozu dient MATLAB für Predictive Analytics?

  1. MATLAB-Analysen arbeiten mit geschäftlichen und technischen Daten.
    MATLAB bietet native Unterstützung für Sensor-, Bild-, Video-, Telemetrie-, Binär- und andere Echtzeit-Datenformate. Untersuchen Sie diese Daten mit Tall-Arrays von MATLAB für Hadoop und Spark und indem Sie Schnittstellen mit ODBC-/JDBC-Datenbanken verbinden.
  2. Mit MATLAB können Ingenieure selbst im Data Science tätig werden.
    Ermöglichen Sie es Ihren Fachexperten, sich wissenschaftlich zu betätigen: mit leistungsstarken Tools für Machine Learning, Deep Learning, Statistik, Optimierung, Signalanalyse und Bildverarbeitung.
  3. MATLAB-Analysen können auf Embedded Systems verwendet werden.
    Entwickeln Sie Analysefunktionen zur Ausführung auf Embedded-Plattformen, indem Sie portablen C- und C++-Code aus MATLAB-Code generieren.
  4. MATLAB-Analysen können auf IT-Systemen von Unternehmen bereitgestellt werden.
    MATLAB kann mit einer Laufzeitumgebung in Unternehmenssysteme, Cluster und Clouds integriert werden, die lizenzgebührenfrei bereitgestellt wird.

Ihre Daten + MATLAB = Erfolg mit Predictive Analytics

In dieser vereinfachten Betrachtungsweise stammen technische Daten von Sensoren, Messinstrumenten und vernetzten Systemen in der Praxis. Die Daten werden gesammelt und in einem Dateisystem gespeichert, das sich vor Ort oder in der Cloud befindet.

Die Architektur von Predictive Analytics wird durch die technische Entwicklung bestimmt.

Abbildung 4: Architektur von Analysefunktionen, die auf Technik basieren.

„Ganz gleich, in welcher Branche unser Kunde arbeitet und welche Daten wir für ihn analysieren sollen – Text, Audio, Bilder oder Video – mit MATLAB-Code können wir schneller klare Ergebnisse bereitstellen.“

Diese Daten werden mit Daten von herkömmlichen Business-Systemen kombiniert, wie Kostendaten, Vertriebsergebnissen, Kundenbeschwerden und Marketing-Informationen.

Danach werden die Analysefunktionen mithilfe von MATLAB von einem Techniker oder Fachexperten entwickelt. Fast immer ist eine Vorverarbeitung erforderlich, um mit fehlenden Daten, Ausreißern oder anderen unvorhergesehenen Problemen der Datenqualität umzugehen. Danach werden Analysemethoden wie Statistik und Machine Learning verwendet, um eine „Analytik“ zu erstellen: ein prädiktives Modell Ihres Systems.

Um praktischen Nutzen zu erzielen, wird das prädiktive Modell nun bereitgestellt. Dies kann in einer IT-Produktionsumgebung erfolgen, die die Grundlage für ein transaktionsbasiertes oder IT-bezogenes Echtzeit-System wie eine eCommerce-Website bildet. Alternativ kann es auf einem Embedded-Gerät erfolgen, wie einem Sensor, einem Controller oder einem intelligenten System in der Praxis, etwa einem autonomen Fahrzeug.

Eine Nutzung von MATLAB und Simulink® als Teil dieser Architektur ist ideal, da die Tools einfache Bereitstellungspfade für Embedded Systems mit Model-Based Design ermöglichen – oder für IT-Systeme mit Anwendungsbereitstellungs-Produkten.

Prädiktive Modelle können auf intelligenten Systemen und Embedded Systems, in der Cloud und auf Unternehmenssystemen bereitgestellt werden.

Abbildung 5: Bereitstellung prädiktiver Modelle auf Embedded Systems und IT-Systemen.

„MATLAB hat bei der Beschleunigung unserer F&E sowie der Implementierung geholfen. Dies war durch robuste numerischen Algorithmen, umfangreiche Visualisierungen und Analysetools, zuverlässige Optimierungsroutinen, Unterstützung für objektorientiertes Programmieren und die Fähigkeit, unsere Java-Produktionsanwendungen in der Cloud zu betreiben, möglich.“