Nach dem Paukenschlag der Veröffentlichung der ersten auch für Endnutzer verfügbaren large language models (LLMs) um den Jahreswechsel 2022/23, ist deren Weiterentwicklung über das Nachtraining auf der Basis menschlichen Feedbacks, über die Bereitstellung von Informationen aus externen Quellen, die Kombination verschieden trainierter Modelle, wie auch über die interne Zerlegung von Problemen beim reasoning jeweils schon an Grenzen gestoßen. Modelle ganz verschiedener Unternehmen zeigen heute eine weitgehend vergleichbare Performanz, so dass die möglichst umfassende Integration in bestehende Software-Infrastrukturen zum wesentlichen Herausstellungsmerkmal geworden ist.
LLMs machen gewaltige Informationsmengen für Anfragen in natürlicher Sprache zugänglich und können insbesondere Aufgaben wie Übersetzung, Transkription und die Erstellung von Software-Quellcode zumeist souverän bewältigen. Durch das ‚Mixen‘ von Kontexten können zudem implizite Relationen in den Trainingsdaten explizit gemacht werden, was auch für Menschen als innovativ und kreativ gelten würde. Schon beim Programmieren erweisen sich die Systeme allerdings für Profis oft als weniger nützlich denn gehofft – und als Sicherheitsrisiko in den Händen von Laien. Ganz allgemein haben die Modelle Probleme, mit langen Kontexten und irrelevanten Informationen umzugehen. Aber wichtiger noch: Die konstruktionsbedingte ‚Halluzination‘ falscher Sachverhalte lässt sich eindämmen, aber nicht ganz ausmerzen, weil die Modelle nicht mit expliziten Weltmodellen operieren, sondern nur einen statistischen Zugriff auf eine überlagerte Vielfalt von Äußerungen über solche Modelle haben; gerade auch beim reasoning. Versuche, LLMs mit Weltmodellen zu erweitern, laufen in die bekannten Probleme klassischer KI-Ansätze, die ja solche Modelle möglichst effizient zu implementieren versuchten.
Das year of the agents (2025) sieht dementsprechend mehr und mehr Zweifel aufkommen, ob die versprochenen Produktionsgewinne in nicht allzu ferner Zukunft zu realisieren sind. Agentische KI Systeme scheitern weiterhin an komplexen Aufgaben (schon weil mit jedem weiteren Schritt die Chance auf Halluzinationen zunimmt) und für Server-Zugriffe auf spezielle, klarer strukturierte Protokolle zu wechseln, ist kein Zeichen rascher Schritte hin zur menschenähnlichen Intelligenz, sondern ist deshalb nötig, weil das gerade nicht der Fall ist und die Performanz-Gewinne in der KI-Entwicklung Schritt für Schritt geringer werden. Wie nicht unüblich in Wissenschaft und Technik, wurde mit einem (über lange Jahre vor allem auch an Universitäten entwickelten) Näherungs-Ansatz 90% eines Problems gelöst, aber die nächsten 9% erfordern nun ein Vielfaches an Einsatz. Wichtiger noch: Die Bemühungen zielen nun nicht mehr auf das eigentliche Problem ab (das der menschlichen Intelligenz), sondern darauf, die verbliebenen Probleme des erfolgreichen Näherungs-Ansatzes mit einer Vielzahl, letztlich Kontext-spezifischen Lösungen abzuschwächen. Entsprechend werden allzu grandiose Überschriften seltener, während die beteiligten Unternehmen dazu verdammt sind, ihre Narrative der nahenden Errettung und/oder des Untergangs durch KI aufrecht zu erhalten. Hinter den Kulissen sind aber nicht mehr die anvisierte Superintelligenz, oder wenigstens die entwickelten Modelle das große Geschäft, sondern die Hardware und die Energie, die von dem Rest der Welt gebraucht werden, um mitzuspielen. Investoren aus dem mittleren Osten und Ost-Asien sollen dabei die Risiken mittragen. Nach Leuten wie Gary Marcus und Luciano Floridi, warnen nun auch KI-Größen wie Yann Le Cun und Stuart Russell vor den Folgen dieser Entwicklungen. Unglücklicher Weise ist die Lotterie-artige, auf großen Versprechungen basierende Umverteilung von unten nach oben, von staatlichen Ressourcen zu großen Technologie-Konzernen, auch noch mit den sich neu herausbildenden autokratischen Strukturen in den USA verquickt.
Unabhängig davon wird für viele Technologien im KI-Bereich in einigen Jahren das ‚Plateau der Produktivität‘ auf der Hype-Kurve wohl erreicht werden. Neben Spezial-Anwendungen zur Modellierung komplexer Systeme, z.B. in der Klimaforschung, werden Sprachverarbeitung und Objekterkennung in vielfältiger Form wohl weiterhin die wichtigsten Anwendungsfelder bleiben. Das Erkennen, Nachhalten und Analysieren von Objekten bieten große Potentiale für eine Unzahl von Problemen, sei es in der medizinischen Diagnostik oder der Nutzung von Ressourcen in der Landwirtschaft. Sprachmodelle hingegen werden es erlauben, jedwede digitale Funktionalität mit einem vorgeschalteten Interface zu versehen, mit dem wir dann normalsprachlich interagieren können. Gerade für die Philosophie werden auch neue Möglichkeiten zur Verarbeitung und Analyse von Texten und zur (unverbindlichen) Exploration von Wissen eine wichtige Rolle spielen. Und ist die grundlegende Fehleranfälligkeit von Agenten erst einmal akzeptiert, lässt sich deren digitale Umgebung so strukturieren (und unser Verhalten so trainieren), dass ein verlässlicher, produktiver Einsatz möglich wird. Menschliche Intelligenz werden wir auf diesem Wege aber nicht modellieren können.
Die Reihe Philosophia Digitalis hat als einen Schwerpunkt neue Fragen und Probleme, die sich durch neue digitale Medien für die Philosophie ergeben. Mit Blick auf das Obige darf man wohl sagen, dass das Besondere an den neuen KI-Systemen ist, dass mit ihnen unsere digitalen Medien scheinbar ‚erwacht‘ sind. Dieses Erwachen unserer digitalen Medien in Form moderner KI-Systeme wirft uns auf grundlegende philosophische Fragen zurück: (Wie) verarbeiten Menschen qualitative Informationen? Inwieweit macht dies menschliche Intelligenz besonders? Und wie kann es gelingen, diese besondere Intelligenz in Einklang mit den Naturwissenschaften neu zu denken? Wer das hard problem für bare Münze nimmt, kann schlecht argumentieren, dass Maschinen, die mit rein relationaler, quantitativer Information arbeiten, menschliches Denken emulieren können. Gibt es aber eine solche Besonderheit des menschlichen Denkens, so sollte mit ihr ein evolutionär relevanter Vorteil bei der Lösung komplexer Probleme einhergehen. Wissenschaftliche Modelle, die dies erklären könnten, werden aber kaum um eine Erweiterung der Naturwissenschaften umherkommen; sie werden auch nicht-physikalische Eigenschaften als objektive Bausteine unserer Realität anerkennen müssen. Der vorliegende Text zeigt auf, wie wir uns solche Modelle denken dürfen, unter dem (historisch vielleicht nicht allzu günstigen) Label ‚Idealismus‘, im Kern aber einfach als sowohl philosophischer als auch naturwissenschaftlicher Ansatz, der Eigenschaften und nicht raumzeitlich situierte Elementarteilchen als erste Elemente unserer Realität annimmt.
Der größte impact des dann doch nur scheinbaren ‚Erwachens‘ unserer Medien wäre dann, dass er uns die Unmöglichkeit der Umsetzung eines impliziten Grundkonsens großer Teile der klassischen analytischen Philosophie vor Augen führt; nämlich der Idee, dass Bedeutung sich als quantitativ-optimierte, relationale Struktur darstellen lässt. Wie ich im vorliegenden Text zu erläutern versuche, scheinen mir neben dem hard problem auch das symbol grounding problem, das framing problem und was wir über Abstraktion und Universalien wissen, dagegen zu sprechen. Für stärker ‚kontinental‘ orientierte Philosophierende bietet sich hier eine große Chance; ihre Argumente sollten verstärktes Interesse finden – und werden für die nächsten Schritte dringend gebraucht. Meine Antwort auf die Frage, ob menschliches Denken mehr als quantitative Informationsverarbeitung sein könnte, findet sich im vorliegenden Text. In ihm schlage ich (argumentativ ungünstig, aber in der Sache notwendigerweise) einen weiten Bogen; die vorgeschlagenen ‚Lösungen‘ erscheinen für die einzelnen Probleme nicht selten als overkill – aber das Ziel ist eben ein Modell, das insgesamt tragfähig ist. Anstatt ein idealistisches Rückzugsgefecht auf der Basis des hard problem zu führen, wird durchdekliniert, was es bedeuten würde, wenn unser Geist in der Tat qualitative Eigenschaften manipulieren könnte, um erwartbare experimentell nachweisbare Folgen heraus zu arbeiten. Es zeigt sich, dass der ontologische Status abstrakter Entitäten im Kern nicht problematischer ist als derjenige konkreter Entitäten – wenn es denn gelingt, Annahmen und Folgerungen mit unseren besten naturwissenschaftlichen Theorien wie aufgezeigt in Einklang zu bringen und experimentell zu stützen.