Die Debatte über künstliche Intelligenz wird derzeit von immer größeren Sprachmodellen dominiert. Mehr Daten, mehr Chips, mehr Rechenleistung – so scheint die Formel der Branche zu lauten. Doch genau dieses Paradigma stellt der KI-Forscher Yann LeCun zunehmend infrage. Sein neuer Ansatz eines sogenannten „World Models“ könnte darauf hinweisen, dass die nächste Evolutionsstufe der KI nicht allein über gigantische Sprachmaschinen erreicht wird, sondern über ein tieferes Verständnis der realen Welt.

Der Gedanke dahinter wirkt zunächst fast banal: Menschen verstehen ihre Umgebung nicht nur über Sprache. Ein Kind weiß schon früh intuitiv, dass ein Ball herunterfällt, dass Objekte nicht einfach verschwinden oder dass eine Vase am Tischrand gefährlich steht. Dieses Verständnis entsteht nicht primär durch Texte, sondern durch Wahrnehmung, Bewegung und Erfahrung.

Genau hier sieht LeCun die Schwäche heutiger Large Language Models. Systeme wie ChatGPT verfügen zwar über enormes Sprachwissen, doch sie besitzen kein echtes physikalisches Weltverständnis. Sie berechnen Wahrscheinlichkeiten in Sprache – sie simulieren Verständnis, ohne notwendigerweise kausale Zusammenhänge zu erfassen.

Das ist möglicherweise auch der Grund, weshalb heutige KI-Systeme oft paradox wirken: Sie können komplexe Texte schreiben, Bilder erzeugen oder Prüfungen bestehen, scheitern aber teilweise an einfachen Aufgaben der realen Welt. Humanoide Roboter vollführen spektakuläre Bewegungen, haben jedoch Schwierigkeiten mit simplen Alltagssituationen, die für Menschen trivial erscheinen.

LeCuns Ansatz versucht deshalb etwas grundlegend anderes. Die KI soll nicht primär lernen, Sprache fortzusetzen, sondern ein vereinfachtes Modell der Realität entwickeln – ähnlich wie wissenschaftliche Modelle Naturgesetze beschreiben. Ziel ist eine Art intuitive Physik der Maschine.

Besonders interessant ist dabei die Effizienz. Während moderne Sprachmodelle oft monatelang auf Tausenden Hochleistungsprozessoren trainiert werden, konnte LeCuns experimentelles Modell mit vergleichsweise geringem Rechenaufwand trainiert werden. Das deutet auf einen möglichen Paradigmenwechsel hin: Vielleicht entsteht Intelligenz langfristig nicht durch immer größere Datenmengen, sondern durch bessere Modelle der Welt.

Ökonomisch wäre das hochrelevant. Die Entwicklung heutiger Frontier-Modelle ist extrem kapitalintensiv geworden. Nur wenige große Technologiekonzerne können sich die notwendige Infrastruktur leisten. Sollte sich jedoch zeigen, dass kompaktere Weltmodelle effizienter lernen und stabiler generalisieren, könnten die Eintrittsbarrieren für leistungsfähige KI erheblich sinken.

Allerdings steht diese Forschung noch am Anfang. Die aktuellen Weltmodelle operieren in stark vereinfachten Umgebungen – gewissermaßen auf einem digitalen Fahrschulgelände. Die reale Welt ist deutlich chaotischer: Unsicherheit, soziale Dynamik, Sprache, Emotionen und unvollständige Informationen machen sie schwer berechenbar.

Deshalb zeichnet sich zunehmend ein hybrides Zukunftsbild ab. Sprachmodelle könnten weiterhin für Kommunikation, Planung und Wissensrepräsentation zuständig sein, während Weltmodelle physikalisches und kausales Verständnis liefern. Die KI der Zukunft wäre dann weniger eine reine Sprachmaschine als vielmehr ein Zusammenspiel verschiedener intelligenter Systeme.

Gerade darin liegt möglicherweise die eigentliche Bedeutung von LeCuns Ansatz: Er verschiebt die Diskussion von der bloßen Sprachsimulation hin zur Frage, wie Maschinen Realität verstehen können.

Quelle: Süddeutsche Zeitung vom 27.Mai 2026

Mit Hilfe von KI erstellt.