Einordnung von Machine Learning in AI

Machine Learning: Eine Erklärung der Funktionsweise, der Unterkategorien und möglicher Anwendungsfälle

Machine Learning ist eine Unterkategorie der künstlichen Intelligenz, wobei innerhalb komplexer Strukturen wiederkehrende Muster erkannt und nutzbar gemacht werden sollen. Im Vergleich zu klassischen Algorithmen, die eine Rechenvorschrift nach einem fixen Schema darstellen, kann Machine Learning selbstständig Erfahrungen sammeln und daraus Vorhersagen für die Zukunft treffen. Aufbauend auf dem Feedback der Aktionen sind die Modelle in der Lage, selbstständig zu lernen und darauf aufbauend verbesserte Entscheidungen zu treffen. Dies ermöglicht Computern, Aufgaben zu meistern, ohne eine explizite und auf die Aufgabe bezogene Programmierung.

In diesem Beitrag beschreiben wir, wie sich Machine Learning in die Welt der künstlichen Intelligenz eingliedert und wie es funktioniert. Darüber hinaus werden wir Bezug auf die verschiedenen Unterkategorien von Machine Learning nehmen. Dafür werden wir die Funktionsweisen von Supervised, Unsupervised und Reinforcement Learning näher kennenlernen, aktuelle Use Cases betrachten und Vor- & Nachteile ausarbeiten.

Eingliederung von Machine Learning im Bereich künstliche Intelligenzen
Definition und Funktionsweise von Machine Learning
Unsupervised Learning
Supervised Learning
Reinforcement Learning

Eingliederung von Machine Learning im Bereich künstliche Intelligenzen

Definition künstliche Intelligenz: Für den Begriff der “künstlichen Intelligenz” lassen sich viele verschiedene Definitionen finden. Ein Ansatz ist es, zunächst die menschliche Intelligenz allgemein zu definieren und daraus den Begriff der KI abzuleiten.

Intelligenz: Die Eigenschaft, kreative Verknüpfungen zwischen bereits bekanntem Wissen und neuen Eindrücken herzustellen.

Die KI soll dies replizieren können und bedarf dafür drei Charakteristiken:

Verständnis von Sprache & Text
Speicherung, Verarbeitung und Auswertung von aufgenommen Informationen
Lernfähigkeit & flexible Reaktion auf bestehende Umstände

Insgesamt setzt sich die KI somit aus den Teilbereichen Handeln, Wahrnehmen und Lernen zusammen, wobei wir uns in diesem Eintrag auf das Lernen konzentrieren werden.

Die Kategorie des Lernens gleicht die zuletzt gesammelten Daten mit dem vorherigen Wissensstand ab, um den eigenen Output zu verbessern. Dabei soll das Programm auf Basis neuer Erfahrung selbstständig lernen. Im Folgenden werden wir uns auf das Machine Learning konzentrieren.

Definition und Funktionsweise von Machine Learning

Das Machine Learning ist eine Unterkategorie der künstlichen Intelligenz und ermöglicht das Treffen von datenbasierten Vorhersagen. Dafür werden mittels vergangener Problemstellungen und den daraus abgeleiteten Lösungen Erfahrungen gesammelt und neue Lösungen für die aktuelle Problemstellung ausgearbeitet. Je mehr Daten zur Verfügung stehen, desto besser wird das Modell Muster erkennen und zielgerichtete Aussagen treffen. Dabei muss sich das Modell nicht innerhalb von vorgegebenen Regelwerken bewegen, sondern kann darüberhinausgehend selbstständig die optimale Lösung finden.

Ein wichtiges Maß für die Qualität des Outputs ist die Verallgemeinerbarkeit, wodurch das Modell auch bei unbekannten Inputdaten in der Lage ist, den richtigen Output zu generieren. Da das Modell in der Regel mit neuen Daten konfrontiert wird, ist es wichtig, die erlebten Muster auf die neuen Daten anzuwenden.

In der nachfolgenden Grafik ist dargestellt, wie sich die Unterkategorien von Machine Learning von den klassischen heuristischen Regelwerken abtrennen.

Infografik vergleicht traditionelle Programmierung mit Unsupervised, Supervised und Reinforcement Machine Learning

Heuristische Regelwerke: Menschliches Wissen wird verwendet, um spezifische Regeln und Anweisungen zum Lösen von Problemen zu erstellen, die auf Annahmen und Erfahrungen basieren. Ein wesentlicher Nachteil dieser Methode ist, dass kein Lernprozess vorliegt und somit nicht auf neue Daten reagiert werden kann. Der Vorteil ist, dass dieses Vorgehen weniger komplex und aufgrund einer höheren Transparenz leichter interpretierbar ist.

Machine Learning: Befähigt technische Systeme Muster zu erlernen und sich weiterzuentwickeln. Somit ist es im Gegensatz zu den heuristischen Regelwerken in der Lage, auch für unbekannte Daten geeignete Lösungen zu finden. Allgemein lässt es sich in drei Oberkategorien einteilen:

- Unsupervised: Erkennen von Zusammenhängen
- Supervised: Entfernen von Zusammenhängen mit klarem Ziel
- Reinforcement: Eigenständiges Erkennen von richtigen Zusammenhängen

Unsupervised Learning: Erklärung, Anwendungsgebiete, Vor- & Nachteile

Was ist Unsupervised Learning?

Unsupervised Leaning ist eine zentrale Methode des maschinellen Lernens, bei welcher das Modell selbstständig Strukturen in den Daten erkennt. Im Gegensatz zum Supervised Learning stehen keine vorkategorisierten Daten zur Verfügung, stattdessen werden Ähnlichkeiten innerhalb der Inputdaten gefunden. Dadurch sollen verborgene Muster erkannt und wertvolle Erkenntnisse gewonnen werden, die Menschen nicht wahrgenommen hätten.

Wo setzt man Unsupervised Learning ein?

Da bei Unsupervised Learning mit Daten gearbeitet wird, die keine Zielwerte besitzen, eröffnet sich eine große Menge an Use Cases für diese Technologie. Dafür werden im Folgenden die Clusteranalyse, die Dimensionsreduktion und die Anomalieerkennung vorgestellt:

Ähnliche Merkmale in eine Gruppe organisiert

Clustering

Beim Clustering werden ähnliche Daten in einer Gruppe organisiert, ohne dass genaue Informationen über die einzelnen Gruppen verfügbar sind. Die einzelnen Elemente innerhalb einer Gruppe sollten so ähnlich wie möglich sein. So können beispielsweise Kunden, die in der Vergangenheit ähnliche Produkte gekauft haben, zu einer Gruppe zusammengestellt werden und dann das gleiche Produkt angeboten werden.

Dimensionsreduktion

Oftmals haben Datensätze eine große Anzahl an verschiedenen Features, welche als Dimensionen bezeichnet werden. Da die verschiedenen Spalten miteinander korrelieren, ist es möglich, die Anzahl der Spalten zu minimieren, sodass nur zwei oder drei Dimensionen verbleiben. Diese lassen sich anschließend mit einfachen Graphen visualisieren. Einsatz findet dies zum Beispiel in der Blutkrebs-Forschung, da hier die Daten oft mehr als 30 Variablen beinhalten. Diese werden auf drei Dimensionen reduziert und können anschließend visualisiert werden, um Muster zu erkennen.

Anomalieerkennung

Mittels Unsupervised Learning ist es möglich, einzelne Ausreißer in Datensätzen zu identifizieren, die sich von dem normalen Datensatz unterscheiden. Hier ist ein Beispiel die Erkennung von Kreditkartenbetrügern, indem für einen Kunden unübliche Transaktionen identifiziert werden können.

Vorteile

Geringer Aufwand: Trainingsdaten müssen nicht gelabelt sein

Schnelligkeit: Da die Daten nicht gelabelt sein müssen und oft einfachere Modelle im Vergleich zum Supervised Learning genutzt werden können, kann die Geschwindigkeit gesteigert werden

Skalierbarkeit: Es ist möglich, diese Algorithmen auf eine große Datenmenge anzuwenden

Nachteile

Eingrenzung: Erlaubt nur Klassifizierungsaufgaben

Bewertbarkeit: Da keine klaren Ausgabewerte vorhanden sind, ist die Möglichkeit der Bewertbarkeit eingeschränkt

Menschliche Interpretation: Es muss eine durch Menschen durchgeführte Evaluation der erstellten Cluster stattfinden

Supervised Learning: Erklärung, Anwendungsgebiete, Vor- & Nachteile

Was ist Supervised Learning?

Supervised Learning gehört in die Kategorie des Machine Learning und benötigt im Vergleich zu dem Unsupervised Learning gelabelte Daten. Das bedeutet, dass der Input und der Output gekennzeichnet sind, um Ergebnisse zu messen und zu verbessern. Der Algorithmus erkennt aus Trainings-Datensätzen Muster und wendet diese auf neue Eingaben an. Daher ist die Qualität der Trainingsdaten besonders relevant für diese Art von Algorithmen.

In der vorherigen Grafik ist das Grundprinzip von Supervised Learning dargestellt. Dabei wird das Modell zunächst mit labeled Training Data vortrainiert (hier beispielsweise die Geometrie mit den richtigen Begriffen) und kann das Erlernte anschließend auf neue Daten anwenden. Entsprechend dem Beispiel aus der Grafik können somit den geometrischen Formen aus dem neuen Datensatz die richtigen Begriffe zugeordnet werden.

Wo setzt man Supervised Learning ein?

Für ein genaueres Verständnis von Supervised Learning werden im Folgenden die gängigsten Anwendungsgebiete dieser Technologie vorgestellt. In diesem Rahmen wird auch auf die Klassifikation und die Regression eingegangen.

Klassifikation

Hierbei versucht das Model, den Inputdaten das richtige Label zuzuordnen, um Entscheidungsprobleme zu lösen. Um dies zu erreichen, wird eine Funktion gesucht, die die Daten in Klassen unterteilt. Dies ermöglicht eine Vorhersage von diskreten Werten. So kann dieses Verfahren beispielsweise für die Klassifizierung von Spam-Mails eingesetzt werden.

Regression

Ziel der Regression ist es, die Beziehung zwischen den Variablen zu analysieren, um eine Prognose zu ermöglichen. Dafür muss eine Mapping-Funktion gefunden werden, mithilfe derer der Input auf den kontinuierlichen Output gemappt werden kann. Dies setzt man beispielsweise für Umsatzprognosen oder die Vorhersagen von Preisen für Immobilien ein.

Was sind die Vor- & Nachteile von Supervised Learning?

Nachdem wir den grundlegenden Mechanismus und die Anwendungsgebiete von Supervised Learning erläutert haben, gehen wir im Folgenden auf die Vor- & Nachteile ein.

Vorteile

Transparenz: Anders als bei Unsupervised Learning ist das Ergebnis hier besser nachvollziehbar

Sicherheit: Kontrollierte Lernumgebung durch das Verwenden von gelabelten Daten

Nachteile

Aufwendiges Pre-Processing: Die Daten müssen durch menschliche Intelligenz gelabelt werden

Wartung: Benötigt regelmäßige Updates

Begrenzt: Im Gegensatz zum Unsupervised Learning können hier keine unbekannten Informationen aus dem Datensatz gewonnen werden

Reinforcement Learning: Erklärung, Anwendungsgebiete, Vor- & Nachteile

Was ist Reinforcement Learning?

Reinforcement Learning ist die dritte Kategorie des Machine Learning und zielt darauf ab, dass ein Agent selbstständig eine Strategie erlernt. Mittels dieser entscheidet er, in welcher Situation welche Aktion ausgeführt werden soll, um die Belohnungsfunktion zu maximieren. Die grundlegende Funktionsweise ist in der nachfolgenden Grafik abgebildet:

Schematische Darstellung des Reinforcement Learning mit Agent, Aktion, Belohnung und Umgebung

Zu jedem Zeitpunkt t erhält der Agent eine Repräsentation seiner Umwelt, welche als State St bezeichnet wird. Abhängig von diesem State wählt der Agent eine Action At aus. In der nächsten Periode (t+1) hat sich die Umwelt verändert und hat nun den State S(t+1). Dabei erhält der Agent noch einen Reward R(t+1) für die Action At aus State St. Dieser Prozess wiederholt sich, der Agent lernt aus jeder Interaktion mit der Umwelt dazu und passt seine Strategie entsprechend an. Da Reinforcement Learning ein breiter Überbegriff ist, werden wir in einem weiteren Eintrag detaillierter auf die einzelnen Unterkategorien (MDP & Bandits) eingehen.

Wo setzt man Reinforcement Learning ein?

Da Reinforcement Learning ein breit gefasster Begriff ist und viele Unterkategorien hat, wird sich im Folgenden auf die wichtigsten Anwendungsgebiete konzentriert:

Autonomes Fahren: Reinforcement Learning kann eingesetzt werden, um Autos autonom fahren zu lassen, indem ein Vortraining in einer simulierten Umgebung stattfindet. Dies ermöglicht eine adäquate Reaktion des Autos auf alle möglichen Situationen und Hindernisse im Straßenverkehr. Beispielsweise setzt man Reinforcement Learning ein, um automatische Einparkstrategien oder Überholstrategien bei gleichzeitiger Vermeidung von Kollisionen zu erlernen. Auch kann Q-Learning (eine Art von RL) eingesetzt werden, um den Spurwechselprozess zu optimieren.

Trading: RL kann eingesetzt werden, um den Aktienkurs vorherzusagen. Dafür erlernt der Agent eine Strategie, wie er z. B. Aktien handeln soll, um den Gewinn zu maximieren.

Werbestrategien: Hier wird RL eingesetzt, um dem Kunden das für ihn optimale Produkt vorzuschlagen. Dafür werden Daten über das historische Kundenverhalten sowie weitere Kundendaten, wie z. B. demographische Informationen, verwendet.

Was sind die Vor- & Nachteile von Reinforcement Learning?

Vorteile

Anpassungsfähigkeit: Einsatz in Umgebungen möglich, in denen keine gelabelten Trainingsdaten zur Verfügung stehen

Leistungsfähigkeit: RL kann komplexe Aufgabenstellungen effektiv lösen, da es auf die jeweilige Umwelt reagieren kann

Nachteile

Langer Lernprozess: Agent benötigt viele Interaktionen mit der Umwelt, bis eine geeignete Policy gefunden wurde

Geringe Transparenz: Da die Entscheidungen aus einem interaktiven Prozess resultieren, ist der entstandene Output oftmals schwer nachzuvollziehen

In diesem Beitrag haben wir uns mit einer allgemeinen Einführung in das Machine Learning beschäftigt und die grundlegenden Mechanismen erläutert. Aufbauend auf diesem Wissensstand können wir nun tiefer in die einzelnen Modelle eintauchen. Dafür werden in dem Folgenden Beitrag für die drei Oberkategorien (Supervised, Unsupervised, Reinforcement Learning) ausgewählte Algorithmen erläutert.

Wenn ihr Lust habt weitere reale Anwendungsfälle von KI kennenzulernen, guckt euch gerne unsere KI-Produkte an. Beispielsweise verwenden wir Unsupervised Learning Algorithmen bei unserem Produkt blue.LEAD, um Websiteinhalte zu Clustern zusammenzufassen (klicke hier). Wenn ihr noch mehr zu Reinforcement Learning erfahren wollt, schaut euch gerne den Use Case zu blue.ACTION an (klicke hier).

Features

Onboarding

FAQ

Features

Onboarding

FAQ

Einordnung von Machine Learning in AI

Machine Learning: Eine Erklärung der Funktionsweise, der Unterkategorien und möglicher Anwendungsfälle

Eingliederung von Machine Learning im Bereich künstliche Intelligenzen

Definition und Funktionsweise von Machine Learning