KI ohne Hype: Wie lernt eine KI?

Kein Kind lernt Fahrradfahren durch eine Erklärung der Physik. Es steigt auf, fällt hin, versucht es wieder. Nach einigen Stunden, und einigen Schrammen, klappt es. Das Kind weiß intuitiv, wie es das Gleichgewicht hält. Ohne je eine Formel gesehen zu haben.

Eine KI lernt ähnlich. Nicht durch Regeln, die jemand einprogrammiert, sondern durch Beispiele. Viele Beispiele. Und durch Fehler.

Was beim Training passiert

Bevor ein Modell überhaupt lernen kann, muss jemand die Trainingsdaten vorbereiten und bewerten, das bedeutet, tausende Kundenanfragen manuell zu klassifizieren: Kündigung, Beschwerde, Zählerstand, allgemeine Frage. Das kostet Zeit und Geld, und wird in der Praxis oft unterschätzt.

Erst dann beginnt das eigentliche Training. Das Modell analysiert die klassifizierten Daten, macht eine Vorhersage, vergleicht sie mit der richtigen Antwort und korrigiert sich. Dieser Vorgang wiederholt sich millionenfach. Nach und nach lernt das Modell welche Merkmale relevant sind, und welche nicht. Am Ende kann es neue, unbekannte Anfragen einschätzen.

Aber auch dann arbeitet das Modell nicht einfach still vor sich hin. Das Modell braucht einen Menschen, der das Modell überwacht, die Ergebnisse bewertet und es nachtrainiert, wenn nötig. Nicht weil das Modell schlecht ist, sondern weil kein Modell alle Ausnahmen kennt, die der Alltag produziert. Zudem verändert sich die Realität stätig, neue Produkte, neue Prozesse, neue Formulierungen. Auch nach alledem Training wird KI Fehler machen.

Das Kind fällt manchmal vom Fahrrad, auch wenn es längst gelernt hat zu fahren. Das gehört dazu. Wer damit umgehen kann, kommt schneller ans Ziel als zu Fuß.

Mehr Daten sind nicht automatisch besser

Eine häufige Annahme: Je mehr Daten, desto besser das Ergebnis. Das stimmt, aber nur wenn die Daten gut sind. Die Trainingsdaten müssen die Realität repräsentieren, also die Vielfalt der Situationen abbilden, mit denen das Modell später konfrontiert wird. Ein Modell, das nur auf Kundenanfragen aus dem Sommer trainiert wurde, kann im Winter anders performen.

Ich habe Fahrradfahren auf einem alten Rad ohne Gangschaltung und mit Rücktrittbremse gelernt. Die Technik saß, aber bis heute komme ich mit einer modernen Gangschaltung nicht wirklich klar.

Genauso lernt eine KI aus schlechten oder verzerrten Daten falsche Muster. Datenqualität ist deshalb keine technische Nebensache, sie bestimmt wie gut das Ergebnis in der Realität ist.

Was ist eigentlich ein Modell?

Ein Modell ist ein mathematisches Konstrukt das Muster in Daten erkennt und daraus Vorhersagen ableitet. Es wird nicht mit festen Regeln programmiert, es entwickelt seine eigenen Regeln aus Beispielen. Genau darin liegt der Unterschied zu klassischer Software.

Die Gefahr des Überlernens

Es gibt noch ein weiteres Phänomen, das in der Praxis oft überrascht: Overfitting, auf Deutsch überanpassen. Ein Modell, das zu lange auf denselben Daten trainiert wird, lernt diese Daten auswendig, statt die dahinterliegenden Muster zu verstehen.

Das Resultat: Das Modell performt auf den Trainingsdaten ausgezeichnet, und versagt bei neuen, echten Daten. In der Praxis merkt man das oft erst dann, wenn es zu spät ist.

Wann ist ein Modell in der Praxis gut einsetzbar?

Ein Modell ist nicht entweder gut oder schlecht, es ist mehr oder weniger geeignet für einen bestimmten Zweck.

Die Fehlertoleranz muss zur Anwendung passen. Eine Erkennungsrate von 85% kann für eine erste Priorisierung von Kundenanfragen ausgezeichnet sein, für eine automatisierte Entscheidung ohne menschliche Kontrolle wäre sie möglicherweise zu niedrig. Und wenn ein Prozess gar keine Fehlertoleranz zulässt, ist ein KI-Modell schlicht das falsche Werkzeug, denn kein Modell ist jemals 100% korrekt. In solchen Fällen lohnt es sich, andere Automatisierungsansätze in Betracht zu ziehen.

Dasselbe Prinzip, überall

Ob ein Modell Bilder erkennt, Kündiger identifiziert, Texte generiert oder Anomalien in Verbrauchsdaten findet, das Grundprinzip ist dasselbe. Beispiele zeigen. Fehler korrigieren. Wiederholen.

Was sich unterscheidet ist die Architektur des Modells, die Art der Daten, und wie viel Sorgfalt in die Vorbereitung der Trainingsdaten geflossen ist. Letzteres ist der Faktor, der in der Praxis am meisten über Erfolg und Misserfolg entscheidet.

Das Kind auf dem Fahrrad braucht ein gutes Fahrrad, etwas Zeit, und jemanden, der es nach jedem Hinfallen wieder aufmuntert. Eine KI braucht gute Daten, genügend Rechenleistung, und jemanden, der die richtigen Fragen stellt.