Der TRR erklärt

Maschinelles Lernen - Wie Computer aus Daten lernen

 

Wenig ist momentan so alltagsprägend wie die künstliche Intelligenz (KI). Auch wenn sie oft unsichtbar im Hintergrund arbeitet – viele der Technologien, die wir täglich wie selbstverständlich nutzen basieren auf sogenannten intelligenten Algorithmen. Wenn wir eine Suchanfrage bei Google starten, hilft uns eine KI, die relevantesten Informationen zu finden. Unser e-Mail-Postfach wird durch KI von Spam freigehalten, und beim Online-Shopping oder Streaming erhalten wir maßgeschneiderte Vorschläge, die eine KI für uns berechnet hat. Auch Sprachassistenten, die auf unsere Fragen antworten, autonomes Fahren, oder Sicherheitssysteme, die Kreditkartenbetrug erkennen, sind ohne künstliche Intelligenz nicht mehr denkbar. Doch wie funktioniert diese Technologie, die so viele Bereiche unseres Lebens beeinflusst? Und was genau ist der Unterschied zwischen KI und Maschinellem Lernen (ML)?

Was ist Maschinelles Lernen (ML)?

Maschinelles Lernen ist ein Zweig der KI und der zentrale Baustein, der die KI-„Revolution“ antreibt. Die Kernidee ist, dass Computersysteme die Fähigkeit erhalten, aus Daten zu lernen und sich zu verbessern, ohne dass jeder einzelne Schritt explizit von einem Menschen vorgegeben (programmiert) werden muss. Anstatt festen Regeln zu folgen, erkennen ML-Algorithmen Muster in großen Datenmengen und nutzen diese, um Vorhersagen zu treffen oder Aufgaben automatisch zu erledigen. 

Was bedeutet „lernen“ überhaupt?

„Lernen“ heißt beim Computer nicht, dass er versteht. Lernen bedeutet: Ein Programm passt viele interne Stellschrauben so an, dass es für bekannte Beispiele möglichst gute Antworten gibt und idealerweise auch für neue, ähnliche Fälle. Man kann es sich wie das menschliche Lernen vorstellen: Ein Kind lernt, einen Apfel von einer Orange zu unterscheiden, indem es viele Beispiele von beidem gesehen hat. Ähnlich "trainiert" man ein ML-Modell mit Beispieldaten. Hat es genügend Daten "gesehen", kann es selbstständig neue, unbekannte Daten korrekt einordnen.

Wichtig ist: ML kann sehr gut in Bereichen sein, in denen Menschen zwar ein Ergebnis erkennen („Das ist eine Orange“, „Das ist ein Apfel“, „Das klingt plausibel“), aber die Regeln dafür schwer vollständig aufzuschreiben wären. Gleichzeitig bleibt ML immer davon abhängig, welche Beispiele es gesehen hat, das heißt, desto mehr Daten es sieht, desto besser kann es lernen.

Wie ein Modell besser wird

Im Zentrum steht ein Modell: eine Rechenvorschrift, die Eingaben (z.B. Text, Bild, Messwerte) in Ausgaben (z.B. Kategorie, Zahl, Textvorschlag) übersetzt. Beim Training macht das Modell zunächst Vorhersagen, vergleicht sie mit der richtigen Antwort und wird so angepasst, dass der Fehler im nächsten Durchlauf kleiner wird.

Das kann man sich wie Üben vorstellen: Erst liegt man oft daneben, dann wird man genauer, weil man aus Rückmeldungen lernt. Der Unterschied: Beim ML wird dieses „Üben“ tausende bis millionenfach automatisiert wiederholt.

Wie kann ein Modell lernen?

Es gibt verschiedene Arten von Lernmethoden, die je nach Problem und verfügbaren Daten eingesetzt werden. Die drei Haupttypen sind: Überwachtes lernen, unüberwachtes lernen und reinforcement (verstärkendes) lernen. 

Überwachtes lernen (supervised learning):  Beim überwachten Lernen arbeiten wir mit "beschrifteten" Daten. Das bedeutet, jede Information im Datensatz hat bereits eine korrekte Antwort oder ein "Label". Der Algorithmus lernt, die Verbindung zwischen den Eingabedaten und der korrekten Ausgabe herzustellen. Ein Beispiel wäre hier, wenn man dem Computer viele Bilder zeigt von Äpfeln und Orangen, diese aber als „Apfel“ und „Orange“ beschriftet. Nach dem Training kann der Computer selbständig auf neuen Bildern erkennen, ob ein Apfel oder eine Orange zu sehen ist.

Typische Aufgabenarten für überwachtes Lernen sind Klassifikation: „Welche Kategorie ist das?“ (Spam/Nicht Spam, Defekt/OK, Rot/Blau/Grün) oder Regression: „Welche Zahl ist wahrscheinlich?“ (Temperatur morgen, Stromverbrauch, Lieferzeit).

Unüberwachtes lernen (unsupervised learning): Im Vergleich zum überwachten lernen arbeiten unüberwachte Lernalgorithmen mit Daten, die keine Beschriftungen bzw. vordefinierte Labels haben. Das Ziel ist es, verborgene Muster, Strukturen oder Gruppen in den Daten selbst zu finden. Wir können wieder das Beispiel mit Apfel- und Orangebildern verwenden – mit dem Unterschied, dass wir dem Algorithmus nur die Bilder ohne Beschriftungen geben. Das bedeutet, dass der Computer vorab nicht weiß, was „Apfel“ und was „Orange“ ist, sondern Bilder anhand von Ähnlichkeiten und Unterschieden in den Mustern gruppiert (z.B. über Clustering). Wichtig ist dabei: Die gefundenen Gruppen müssen nicht zwingend „Apfel“ und „Orange“ entsprechen, sondern können auch nach anderen Merkmalen entstehen (z.B. Hintergrund, Bildqualität, Beleuchtung), je nachdem, was in den Daten dominiert.

Generieren (z.B. Bild- oder Textgenerierung) gehört zum Bereich generativer Modelle, wird oft zu unüberwachtem Lernen gezählt, ist aber nicht automatisch „unüberwachtes Lernen“ im engen Sinn. Unüberwachtes Lernen umfasst klassisch vor allem Verfahren wie Clustering, Assoziationsanalyse und Dimensionsreduktion. Large Language Models werden häufig ohne manuell vergebene Labels trainiert, dennoch ist „selbstüberwachtes Lernen“ (self-supervised learning) dafür meist die präzisere Einordnung als „unüberwachtes Lernen“.

Verstärkendes lernen (reinforcement learning): Das verstärkende Lernen ist dem menschlichen Lernen am nächsten. Bei dieser Methode lernt ein System durch Interaktion mit einer Umgebung. Es probiert verschiedene Aktionen aus und erhält dafür Belohnungen oder Bestrafungen (positives oder negatives Feedback). Das Ziel ist, eine Strategie zu entwickeln, die die Belohnungen maximiert.

Ein Beispiel ist Schach. Ein Computer lernt, ein Schachspiel zu meistern. Er spielt Millionen von Partien gegen sich selbst. Jeder Zug, der ihn näher an den Sieg bringt, wird "belohnt", jeder schlechte Zug "bestraft". Mit der Zeit lernt er, die besten Züge zu machen.

Verstärkendes Lernen findet Anwendung in autonome Fahrzeugen, Robotersteuerung oder der Entwicklung von Spiel-KIs.

Anwendung in der Praxis in der Chemie

Der größte Vorteil des maschinellen Lernens liegt dabei in seiner Fähigkeit zur Automatisierung. Sobald ein Algorithmus gelernt hat, eine Aufgabe zu erfüllen, kann er sie schnell und effizient ohne menschliches Eingreifen ausführen. Es gibt jedoch nicht den einen Algorithmus, der alle Probleme lösen kann; die Wahl des richtigen Modells hängt immer von der spezifischen Aufgabe und den Daten ab. Wir nutzen ML im CRC für verschiedenste Aufgaben. Beispielsweise verwenden wir Regressionsmodelle (überwachtes Lernen), um vorherzusagen, wie gut eine chemische Reaktion unter bestimmten Bedingungen verlaufen oder wie sich Moleküle nach Lichteinstrahlung verhalten. Ebenso verwenden wir generative Modelle, um neue Moleküle zu designen und vorherzusagen, die dann im Experiment getestet werden können. Verstärkendes Lernen kann verwendet werden, um chemische Reaktionen zu verbessern (verschnellern) oder die Bedingungen davon zu optimieren. Wichtig in jeder Anwendung sind die zugrundeliegenden Daten, denn ein ML Modell kann nur so gut sein wie die Daten selbst. Sind die Daten also ungenau oder von geringem Bestand kann auch ein ML Modell nur beschränkt performen.