Ground Truth

Was ist Ground Truth?

Als „Ground Truth“ werden reale Daten zum Trainieren und Testen von KI-Modellausgaben bezeichnet. Viele KI-Anwendungen benötigen Ground-Truth-Daten, beispielsweise Anwendungen für autonomes Fahren sowie zur Audio- oder Spracherkennung.

Ground-Truth-Daten sind in zwei Stadien der Entwicklung eines KI-Algorithmus unerlässlich:

  1. Modelltraining: Ground-Truth-Daten dienen als Trainingsdaten. Der Algorithmus lernt also, welche Merkmale und Lösungen sich für die konkrete Anwendung eignen.
  2. Modelltests: Ground-Truth-Daten fungieren als Testdaten, um den trainierten Algorithmus hinsichtlich seiner Modellgenauigkeit zu testen.

Ground-Truth-Daten gibt es in vielen Formen: Bild-, Signal- oder Testdaten (Abb. 1). Ground-Truth-Daten manuell zu gewinnen, kann zeitaufwändig sein. Daher kann MATLAB® den Vorgang mit Labeler-Apps für Bild-, Signal-, Audio- und LiDAR-Anwendungen beschleunigen.

Illustration der Ground Truth für drei Arten von Daten: Signal (oben links), Bild (oben rechts) und Text (unten).

Abbildung 1: Ground-Truth-Daten in Form von Signaldaten (links oben), Bilddaten (rechts oben) und Text (unten).

Gewinnung von Ground-Truth-Daten

Um Ground-Truth-Daten zu generieren, ist eine Ground-Truth-Kennzeichnung erforderlich. Bei der Kennzeichnung werden Rohdaten entsprechend ihrer Bedeutung charakterisiert. Die gekennzeichnete Ausgabe wird zum Trainieren eines überwachten Lernmodells benötigt. Je genauer die Kennzeichnung, desto genauer das Modell. Die manuelle Kennzeichnung von Ground-Truth-Daten kann zeitaufwändig sein, da viele KI-Modelle Tausende oder Millionen gekennzeichneter Datenausgaben benötigen, um genaue Ergebnisse zu erzielen.

Die folgenden Labeler-Apps von MATLAB ermöglichen eine voll- oder halbautomatische Kennzeichnung und benötigen daher weniger Zeit als das manuelle Kennzeichnen.

Bildkennzeichnung

Mithilfe von Image Labeler werden Regionen von Interesse auf Bildern gekennzeichnet, beispielsweise Pixel zur semantischen Segmentierung oder Rahmen für Objekterfassungssabläufe.

Kennzeichnung von Bildern (Definition der Ground Truth) mithilfe der Image Labeler-App.

Abbildung 2: Kennzeichnen von Bildern mit der Image Labeler-App.

Signalkennzeichnung

Mithilfe von Signal Labeler können Sie Daten untersuchen sowie Attribute, Regionen von Interesse und Punkte durch Visualisierung und individuell erstellte Funktionen kennzeichnen.

Kennzeichnung von Signalen (Definition der Ground Truth) mithilfe der Signal Labeler-App.

Abbildung 3: Kennzeichnen von Signalen mithilfe der Signal Labeler-App.

LiDAR-Kennzeichnung

LiDAR Labeler erstellt Rahmen um 3D-Objekte und verfügt über Automatisierungstechniken zum Clustern, Entfernen der Grundfläche und Nachverfolgen von Punktwolkendaten.

Kennzeichnung von LiDAR-Punktwolken (Definition der Ground Truth) mithilfe der Lidar Labeler-App.

Abbildung 4: Kennzeichnen von LiDAR-Punktwolken mithilfe der LiDAR Labeler-App.

Siehe auch: deep learning, convolutional neural network