Datenvisualisierung

 

Was versteht man unter Datenvisualisierung?

3 Dinge, die Sie wissen sollten

Die Datenvisualisierung übersetzt Daten in grafische Darstellungen wie Diagramme, Karten und 3D-Visualisierungen, mit denen sich Muster, Trends und Abweichungen in den Daten leicht erkennen lassen.

Mit diesen Datenvisualisierungen lassen sich Zusammenhänge erkennen, die bei einer reinen Betrachtung der Rohdaten nur schwer oder gar nicht zu beobachten wären, insbesondere bei großen Datensätzen aus Quellen wie Sensoren, Datenloggern, medizinischen Aufzeichnungen sowie Internetsuch- und Kaufmustern. Bei der Umwandlung von Daten in verwertbare Informationen spielt die Datenvisualisierung eine zentrale Rolle.

Was sind die Vorteile der Datenvisualisierung?

Die Visualisierungsmethoden für Daten unterscheiden sich nach Fachgebiet.

Computational Finance

Frühere oder aktuelle Marktdaten werden zur schnelleren Erkennung von Mustern und Trends, der Identifizierung von Unregelmäßigkeiten und der Gewinnung aussagekräftiger Erkenntnisse visualisiert. Die Datenvisualisierung trägt dazu bei, Analysen durchzuführen, prädiktive Modelle zu entwickeln, Risiken zu bewerten und Handelsstrategien zu formalisieren.

Das nachstehende Diagramm simuliert das künftige Verhalten der Strompreise am Spotmarkt anhand eines Zeitreihenmodells, das an die historischen Daten angepasst wurde.

Diagramm der Spotpreise für Strom, das die historischen Spotpreise und Trends mit den simulierten Spotpreisen und Trends zeigt. Das Datum befindet sich auf der x-Achse und der Spotpreis auf der y-Achse.

Diagramm der Spotpreise für Strom, das die historischen Daten mit dem prognostizierten deterministischen Trend zeigt.

Signalverarbeitung

Die Signalverarbeitung wird in Anwendungen wie der Sprachanalyse, der Überwachung der Herzfrequenz, der drahtlosen Kommunikation, der Fernerkundung, der Klimaüberwachung und der GPS-Technik eingesetzt. Zu den typischen Aufgaben gehören die Vorverarbeitung und der Vergleich von Signalen, die Entwicklung digitaler Filter, die Umwandlung von Signalen, die Durchführung von Messungen und die Erkennung von Mustern und Ereignissen. Anhand von Datenvisualisierungen werden hierbei relevante Signale im Zeit- und Frequenzbereich sowie im Zeit-Frequenz-Bereich analysiert.

Das folgende Diagramm zeigt die Audiodaten eines pazifischen Blauwals. Die Visualisierung erfolgt in MATLAB® mithilfe der Signal Analyzer App, mit der man Signale im Zeit- und Frequenzbereich visualisieren kann.

Ein Screenshot der Signal Analyzer App mit Signaldaten, die aus den Audiodaten eines pazifischen Blauwals extrahiert wurden, und einer entsprechenden grafischen Darstellung der Daten.

Aus dem Audiomaterial eines pazifischen Blauwals extrahierter relevanter Bereich.

Bildverarbeitung und Computer Vision

Die Bild- und Videoverarbeitung erleichtert das Erkennen von Formen, Zählen von Objekten, Identifizieren von Farben, Messen von Objekteigenschaften und das Auffinden weiterer nützlicher Informationen. Bildverarbeitungstechniken werden häufig als Vorverarbeitungsschritt im Computer-Vision-Workflow herangezogen. Zu den Anwendungen in diesem Bereich gehören unter anderem die Gesichtserkennung für Smartphones, die Fußgänger- und Fahrzeugvermeidung in selbstfahrenden Fahrzeugen, die Videoüberwachung, die Tumorerkennung in MRT-Geräten und andere Bildabfragesysteme.

Beispielsweise verwendet BMW Computer-Vision-Funktionen in Assisted Driving View (ADV) zur Darstellung von Fahrzeugen in der Umgebung und zur Erkennung der Fahrzeugtypen.

Ein Screenshot aus B M W Assisted Driver View zur Demonstration der Objekterkennung.

BMW Assisted Driver View. MATLAB wurde zur automatischen Verifikation verwendet, einschließlich der Bildregistrierung, Objekterkennung, Ground-Truth-Kennzeichnung und Prüfung der ADV-Szene anhand der Testausgabe.

Künstliche Intelligenz (KI)

Bei der Entwicklung von KI-Modellen – sei es mithilfe von Machine Learning oder Deep Learning – spielt die Datenvisualisierung eine wichtige Rolle, da die Modelle auf umfangreichen Datensätzen beruhen, die schwer zu interpretieren sind. Für das Machine Learning erleichtert die Clusteranalyse die Erkennung von Unregelmäßigkeiten und die Vorverarbeitung von Daten beim Supervised Learning. Die Hauptkomponentenanalyse (PCA) und t-distributed Stochastic Neighbor Embedding (t-SNE) sind die beiden am häufigsten verwendeten Datenvisualisierungstechniken. Diese tragen dazu bei, die Datendimensionen zu reduzieren, wodurch Sie sich in erster Linie auf die wichtigsten differenzierenden Dimensionen konzentrieren können.

Beim Deep Learning können Sie den Trainingsfortschritt mithilfe von Datenvisualisierungen wie Diagrammen der Netzwerkgenauigkeit und des -verlusts überwachen und trainierte Netzwerke mithilfe von Visualisierungstechniken wie Gradient-weighted Class Activation Mapping (Grad-CAM), Okklusionsempfindlichkeit, lokal interpretierbaren modellagnostischen Erklärungen (LIME) und Deep Dream untersuchen.

Mahalanobis-, Cosinus-, Tschebychev- und euklidische Diagramme von drei verschiedenen Schwertlilienarten.

Diagramme verschiedener Schwertlilienarten mithilfe des Fisher-Iris-Datensatzes. Mithilfe der tsne-Funktion erstellte Visualisierungen.

Wie funktioniert die Datenvisualisierung?

Softwarepakete bieten verschiedene Möglichkeiten zur Umwandlung von Rohdaten in aussagekräftige Visualisierungen, wie z. B. Grafiken, Schaubilder und Diagramme. Nachfolgend sehen Sie ein anschauliches Beispiel für Daten zur Radverkehrsdichte. Allein durch die visuelle Betrachtung der Rohdaten ist es schwierig, eine Beziehung zwischen den Datenpunkten herzustellen.

Vorschau der Rohdaten zur Radverkehrsdichte.
Zeitstempel Tag Gesamt Nach Westen Nach Osten Uhrzeit
‚24-06-2015 07:00:00’ ‚Mittwoch’ 141 13 128 7.
‚24-06-2015 08:00:00’ ‚Mittwoch’ 327 44 283 8
‚24-06-2015 09:00:00’ ‚Mittwoch’ 184 32 152 9
‚24-06-2015 10:00:00’ ‚Mittwoch’ 94 30 64 10
‚24-06-2015 11:00:00’ ‚Mittwoch’ 67 24 43 11.
‚24-06-2015 12:00:00’ ‚Mittwoch’ 66 32 34 12.
‚24-06-2015 13:00:00’ ‚Mittwoch’ 67 32 35 13

Das nachstehende Balkendiagramm zeigt, dass die Radverkehrsdichte an den einzelnen Wochentagen steigt und fällt. Es steht nun fest, dass die Zahl der Radfahrer an Werktagen höher ist als an Wochenenden. Diese Visualisierung lässt den Schluss zu, dass die Radfahrer auf dieser Strecke überwiegend zur Arbeit und zurück pendeln.

Ein Balkendiagramm der durchschnittlichen Anzahl von Fahrradfahrern pro Wochentag.

Mithilfe eines Balkendiagramms dargestellte Daten zum Radverkehrsaufkommen.

Ein Streudiagramm kann verwendet werden, um mehr Erkenntnisse aus denselben Daten zu gewinnen. Das folgende Diagramm zeigt die Gesamtzahl der Fahrräder in Richtung Osten bzw. Westen zu bestimmten Tageszeiten. Aus diesem Diagramm können wir schließen, dass die Strecken in östlicher Richtung zu den Geschäftsvierteln und die Strecken in westlicher Richtung zu Wohngegenden führen. Außerdem können wir feststellen, dass der Berufsverkehr von 8:00-10:00 Uhr auf der ostwärts gerichteten Strecke und von 16:00-18:00 Uhr auf der westwärts gerichteten Strecke stattfindet.

Ein Streudiagramm des Bostoner Radverkehrs. Die Tageszeit wird auf der x-Achse und die Gesamtzahl der Fahrräder auf der y-Achse dargestellt. Blaue Punkte kennzeichnen hierbei die ostwärts fahrenden Radfahrer und orangefarbene Punkte die westwärts fahrenden Radfahrer.

Der Radverkehr in östlicher und westlicher Richtung nach Tageszeit. 

Ein Schwarmdiagramm ist eine spezielle Art von Streudiagramm, das die Dichte des Radverkehrs zu verschiedenen Tageszeiten, Wochentagen und in verschiedenen Richtungen aufzeigen kann.

Ein Schwarmdiagramm des Bostoner Fahrradverkehrs mit Wochentag, Tageszeit und Fahrtrichtung, um die Dichte der Anzahl der Fahrradausleihen anzuzeigen.

Radverkehrsdichte nach Tag und Richtung.

In unserem Beispiel zum Fahrradverkehr ermöglicht uns die Visualisierung der Daten mit verschiedenen Diagrammtypen wie Balken-, Streu- und Schwarmdiagrammen, nützliche Informationen aus dem Datensatz zu extrahieren, wie beispielsweise die Tage mit dem höchsten Verkehrsaufkommen, die Richtung des Pendlerverkehrs und die verkehrsreichste Zeit des Tages.

Datenvisualisierung mit MATLAB

MATLAB ist eine Plattform zur Programmierung und für numerische Berechnungen, die zur Analyse von Daten, Entwicklung von Algorithmen und Erstellung von Modellen genutzt wird. Sie unterstützt den gesamten Workflow der Datenanalyse, einschließlich der Erfassung der Daten direkt in MATLAB, ihrer Analyse und Visualisierung sowie des Exports der Ergebnisse. Sie können interaktive Apps verwenden, um Ihre Daten zu visualisieren, ohne dafür Code schreiben zu müssen. Die Apps generieren dabei automatisch den entsprechenden MATLAB Programmcode für Sie, sodass Sie Ihre Arbeit automatisieren und wiederverwenden können.

Erstellung von Datenvisualisierungen

MATLAB bietet eine breite Palette an integrierten Diagrammtypen wie Linien-, Streu-, Verteilungs- und geografische Diagramme zur Visualisierung von Datensätzen aus einer Vielzahl von Anwendungen. Die Visualisierungen können sowohl interaktiv als auch programmgesteuert mithilfe der MATLAB-Sprache erstellt werden.

Entdecken von Datenvisualisierungen

Sie können Ihre Visualisierung auch interaktiv untersuchen:

  • Vergrößern und Verkleinern eines bestimmten Ausschnitts des Datensatzes
  • Interaktives Schwenken und Drehen von Visualisierungen
  • Anzeige von Trendlinien oder Datenwerten direkt auf der Visualisierung
  • Schattierung und Hervorhebung von Datenpunkten
  • Wechsel zwischen verschiedenen Domänen (z. B. Zeit-, Frequenz-, S- und Z-Domäne)

Kommentierung und individuelle Anpassung von Datenvisualisierungen

Sie können Ihre Visualisierungen interaktiv mit Kommentaren versehen, indem Sie wichtige Informationen hervorheben, die Sie vermitteln möchten. Zum Beispiel:

  • Kommentierung wichtiger Datenpunkte
  • Hinzufügen von Datentipps
  • Hinzufügen von Achsenbezeichnungen
  • Gruppierung nach verschiedenen Farben und Mustern
  • Hinzufügen von Datenmarkierungen, Linienstilen und Farben

MATLAB generiert automatisch Code aus Ihren interaktiven Diagrammmodifikationen. Diesen Code können Sie wiederverwenden, indem Sie ihn in Ihr Skript einfügen.

Ein Diagramm einer Darstellung des I-Q-Signals; x befindet sich auf der x-Achse und die normierte Amplitude auf der y-Achse. Gezeigt werden ein In-Phase-Signal und ein Quadratursignal.

Die Option „Update Code“ erscheint, wenn Sie Ihre Visualisierung ändern.

Komplexe Datensätze können mithilfe einfacher Diagramme nur schwer zu visualisieren sein. Mit MATLAB können Sie individuelle Diagramme erstellen, um Ihre Visualisierungsanforderungen zu erfüllen, und sie mit eigenen Interaktionen versehen. 

Beispiele:

  • Sparklines-Komponente – Erstellen Sie kleine Liniendiagramme, die den allgemeinen Trend jedes Vektors in einem Multi-Vektor-Datensatz, wie einer Tabelle, zeigen. Beobachten und vergleichen Sie die Datentrends für jede Zeile/Spalte.
  • Dichte-Punktediagramm – Verwenden Sie eine Farbe (oder Transparenz), um die Dichte der Punkte zu ermitteln.
Ein Screenshot einer Sparklines-Komponente und eines Dichte-Streudiagramms, die beide unbenannte Daten darstellen.

(Links) Sparklines-Komponente und (rechts) Dichte-Punktdiagramm.

Weitere Beispiele für individuell erstellte Diagrammcontainer finden Sie unter File Exchange auf MATLAB Central.

Exportieren von Datenvisualisierungen

Sie können Ihre individuell erstellten und mit Kennzeichnungen versehenen Visualisierungen direkt exportieren und im Internet, in Präsentationen und Berichten verwenden.

Ein Screenshot zeigt, wie eine Abbildung an einem Ort gespeichert wird.

Export einer Abbildung.

Integration von Datenvisualisierungen mit Datenanalysen

Oftmals wird die Datenvisualisierung mit der Datenanalyse und -vorverarbeitung kombiniert. MATLAB-Apps wie Data Cleaner und Signal Analyzer kombinieren diese Schritte.

Mit interaktiven Reglern können Sie Aktionen festlegen, ohne Code schreiben zu müssen – und die entsprechenden Datenvisualisierungen werden dabei direkt in die App integriert. So können Sie die Ergebnisse einer bestimmten Aufgabe sofort sehen. Sobald die Analyse und die Vorverarbeitung abgeschlossen sind, können die Apps automatisch den entsprechenden MATLAB Programmcode generieren, sodass Sie die Schritte auch bei unterschiedlichen Daten automatisieren können.

Anwendungsspezifische Visualisierungen

Die Toolboxen von MATLAB ermöglichen anwendungsspezifische Visualisierungen sowie interaktive Anwendungen, die die Visualisierung mit der Vorverarbeitung sowie Analyse von Daten kombinieren.

Screenshot der Econometric Modeler App.

Die Econometric Modeller App ermöglicht die Visualisierung und Analyse von univariaten oder multivariaten Zeitreihen (in der Econometrics Toolbox™).

Screenshot eines Amplitudengangdiagramms mit Frequenz in MHz auf der x-Achse und Amplitude auf der y-Achse.

Frequenzgang der einzelnen Stufen eines mehrstufigen digitalen Down-Umwandlers (in der DSP System Toolbox™)

Ein Screenshot eines Diagramms, das ein Spektrum von Nutz- und Störsignalen mit der Frequenz in GHz auf der x-Achse und dBm auf der y-Achse darstellt.

Bluetooth LE-Blockierungs-, Intermodulations- und Träger-Interferenz-Leistungstest (in der Bluetooth® Toolbox).

Screenshot einer Beamforming-Grafik eines Phased-Array-Systems zur Messung der normalisierten Leistung in dB für mehrere Dimensionen.

Beamforming für ein Phased Array-System (in der Phased Array System Toolbox™).

Vernetzung von MATLAB mit anderen Tools zur Datenvisualisierung

Sie können die Berechnungs- und Datenverarbeitungsfunktionen von MATLAB nutzen, um Visualisierungen und Dashboards mit anderen Business Intelligence Tools zu erstellen, z. B:

Fallstudien

Interessante Datenvisualisierungsanwendungen

Anhand der Datenvisualisierungsfunktionen in MATLAB können Unternehmen ihre Forschungsziele effektiv erreichen.

Ford entwickelt Analysetool für Fahrzyklus-Testergebnisse

Das Vehicle Energy Management Engineering Team von Ford entwickelte mithilfe von MATLAB das CycleTool, um die Emissionen, den Kraftstoffverbrauch und die Leistung seiner Fahrzeuge zu evaluieren. Das Tool ermöglicht es ihnen, die Systemleistung zu bewerten, indem sie die Ergebnisse ihrer Hardwaretests mit den Modellvorhersagen und Simulationen visuell vergleichen.

Bericht lesen

Ein Screenshot von MATLAB, in dem die Möglichkeit gezeigt wird, Hardware-Testergebnisse mit Modellvorhersagen und Simulationen zu vergleichen.

Brushing von Daten zur Ermittlung von Trends in der zusammenfassenden Anwendung.

Entschlüsselung des Schmetterlingsflugs mit Hochgeschwindigkeitskameras und einem Windkanal

Wissenschaftler der Universität Lund fanden heraus, was den Schmetterlingen ihr charakteristisches, flatterhaftes Muster verleiht, und nutzten MATLAB hierfür zur Bildverarbeitung, Datenanalyse, Modellierung und Visualisierung. Durch das Studieren des Flugverhaltens von Schmetterlingen können Ingenieure effizientere und dynamischere Flug- oder sogar Schwimmdrohnen entwickeln. Mithilfe der Datenvisualisierungsfunktionen von MATLAB analysierten und verglichen die Wissenschaftler die Leistung ihrer Flügelkonzepte, die auf der Analyse des Flugverhaltens von Schmetterlingen basieren.

Bericht lesen

Vier Diagramme mit verschiedenen Flügeltypen zur Darstellung von Impuls und Energie in normalisierter Zeit.

Ein flexibler Flügel verbessert Kraft und Effizienz des Flügelschlags.

State Street Global Advisors entwickelt Scoring-Modell zur Verbesserung der Transparenz bei ESG-Investitionen

Das Entwicklerteam von State Street Global Advisors erstellte Histogramme, Streudiagramme, Kastengrafiken und andere Visualisierungen, um ihre Algorithmen im Rahmen der Entwicklung von R-Factor™ zu optimieren, einem System, das Anlegern dabei helfen soll, fundierte Entscheidungen zu treffen und ihre Umwelt-, Sozial- und Governance-Bewertungen (ESG) zu verbessern.

Bericht lesen

Zwölf Grafiken bilden ein Histogramm, das die ESG-Bewertungen anhand R-Factor zeigt, sortiert nach den einzelnen Branchen des M S C I World.

Histogramm der ESG-Bewertungen anhand R-Factor sortiert nach Branchen.

Bosch entwickelt eine zentrale Plattform für die Analyse und Visualisierung von Testdaten für die Automobilindustrie

Bosch nutzte MATLAB zur Entwicklung seines ENValyzer (Engineering Test Data Visualizer and Analyzer), einem Tool zur Visualisierung, Verarbeitung, Analyse und Berichterstellung von Testdaten, die von Messgeräten, Prüfständen und Fahrzeugen erfasst wurden. Die Bosch-Ingenieure konnten so die Daten in Einzel-, Sekundär-, Matrixplot- und Mehrachsenansichten darstellen.

Bericht lesen

Ein ENValyzer-Diagramm, das das Prominenzverhältnis (P R) im Vergleich zu den Ergebnissen des R P M-Spektrums zeigt.

ENValyzer-Diagramm der Ergebnisse des Prominenzverhältnisses (PR) im Vergleich zum R P M-Spektrum.