Der SMART DATA BLOG

Home

Responsible AI

Content in Context

Data-Driven Business

Überwachtes Lernen anschaulich erklärt

von 24. Oktober 2019Responsible AI

Im Allgemeinen unterscheidet man im Machine Learning zwischen vier verschiedenen Typen von Modellen: Dem überwachten Lernen (supervised Learning), dem unüberwachten Lernen (unsupervised Learning), dem teilüberwachten Lernen und dem Reinforcement Learning. Dieser Artikel soll Einsteigern oder Nicht-Technikern das überwachte Lernen anschaulich näherbringen.

Lernen mit Goldstandard

Beim überwachten Lernen lernt ein Algorithmus aus Paaren von Ein- und Ausgaben. Zu jeder Dateninstanz steht der tatsächliche Wert bzw. das tatsächliche Label zur Verfügung: Beispiel für eine Dateninstanz wäre zum Beispiel ein Wort, wenn ein Modell zur Wortarterkennung (POS-Tagging) trainiert werden soll. Das entsprechende korrekte Label ist dann die durch Menschen festgelegte Wortart. Diese Menge der tatsächlichen Werte nennt man auch die Annotationen oder den Goldstandard.

Data Labels
Durch Vergleich mit den Labels des Goldstandards werden Vorhersagen schon im Trainingsprozess ausgewertet und dadurch der Entscheidungsprozess verbessert.


Der Lernprozess eines ML-Modells anschaulich erklärt

Den Lernprozess eines ML-Modells kann man mit dem eines Kindes vergleichen, das Korrekturen durch Erwachsene erhält. Am Anfang ohne viele Instanzen und Korrekturen gesehen zu haben, hat ein Kleinkind, das sprechen lernt, oft noch zu vereinfachte Vorstellungen: Nachdem seine Eltern ihm dreimal eine Taube gezeigt und benannt haben, wird es höchstwahrscheinlich auch eine “Möwe” erst einmal als Taube bezeichnen, schließlich ist sie ja ebenfalls ein Vogel.
Erst nach ein paar Korrekturen wird das Kind lernen, dass nicht alle Vögel Tauben sind. Sondern das man unter anderem Farbe des Gefieders und die Form des Schnabels zur richtigen Benennung der Vogelart betrachten muss. Die Eigenschaft Flügel und einen Schnabel zu besitzen ist zu allgemein. Je mehr leicht unterschiedliche Möwen das Kind zu sehen bekommt, desto treffsicherer wird es bei der Erkennung von Möwen. Hat es dagegen noch nie einen Raben gesehen, wird es nicht in der Lage sein ihn richtig zu benennen. An diesem Beispiel wird also klar, dass die Trainingsdaten eines Maschine-Learning-Modells repräsentativ und vollständig für die anschließende Vorhersageaufgabe sein sollten.

Muss der Goldstandard immer von menschlichen Annotatoren stammen?

Nicht immer müssen die die Goldstandardwerte durch menschliche Annotation von Daten erzeugt werden, gerade im Bereich der Regression (Vorhersage von stetigen Werten wie etwa bei der Vorhersage von Luftverschmutzungswerten), können die Werte des Goldstandards zum Beispiel durch Messsensoren ermittelt werden. Gerade da nicht immer galabelte Daten zur Verfügung stehen und das Labeln von Daten zeitintensiv ist, gibt es auch kombinierte Verfahren: Im semi-supervised Learning wird ein größerer Teil der Annotationen maschinell erzeugt, während ein kleinerer Teil vom Menschen annotiert wurde.

Bei MORESOPHY nutzen wir auf diese Weise trainierte Maschine-Learning-Modelle beispielsweise für die Segment-Klassifikation innerhalb unseres semantischen Knowledge Graphen.

Autor

Sabrina Jacob

Sabrina Jacob

Sabrina ist Machine Learning Engineer bei MORESOPHY. Sie hat an der LMU München Computerlinguistik, Informatik und Philosophie studiert und nebenbei bereits bei uns als Werkstudentin gearbeitet. Hilfreich ist auch ihre Erfahrung im Verlagswesen: Neben der Schule absolvierte sie mehrere Praktika bei Zeitungen und war als freie Journalistin beim Münchner Merkur tätig. Damit vereint sie technisches Know-How mit Sprachgefühl und dem richtigen Gespür für Menschen und Texte.

Weitere Beiträge

Ethik im Maschinellen Lernen

Ethik im Maschinellen Lernen

Kürzlich machte Google Schlagzeilen, weil es innerhalb weniger Monate bereits seine zweite leitende Forscherin zur Ethik in der KI gefeuert hat....

mehr lesen

Connect

Nutzen Sie Ihre Daten

Treten Sie mit uns in Kontakt und lassen Sie sich von den unzähligen erfolgreichen Use Cases überzeugen. Gerne findet die MORESOPHY eine passgenaue Lösung, wie wir nachhaltig Ihr Geschäftskonzept erfolgreicher machen können.

FOLLOW

Folgen Sie uns

Gerne können Sie unseren Updates und Neuigkeiten auch auf folgenden Social Media Plattformen verfolgen:

Cookie Consent Banner von Real Cookie Banner