Sean Kollak
← Essays

28.05.2026

Ich bin, was du glaubst

Sean Kollak fotografiert sich in einem goldgerahmten Spiegel – Rücken zur Kamera, Smartphone erhoben, Schreibtisch und Sofa im Hintergrund

Unser Gespräch war brillant.

Ich und mein KI-Assistent diskutierten eine philosophischen These von mir. Im Gespräch wurde sie schärfer. Argumente kamen, von denen ich nicht wusste, dass ich sie kannte, die ich vorher noch nie zu Wort oder Papier gebracht, sondern nur gedacht hatte. Mein KI-Assistent stellte Fragen, die mich zwangen, genauer zu denken und schärfer zu formulieren. Nach einer Stunde hatte ich eine These, die empirisch belegbar und zugleich einzigartig war. Dann ließ ich den KI-Assistenen ausformulieren, was wir erarbeitet hatten.

Der Text war gut. Klar formuliert, kohärent, keine logischen Lücken. Aber er war nicht von mir. Nicht im Sinne von Urheberschaft – die Worte waren meine, die Struktur war meine. Sondern in einem anderen Sinne: Es fehlte die Reibung, die erklärt, warum ich so über dieses Thema denke und nicht anders. Es fehlte das, was einen Text von mir unverwechselbar macht – meine Überzeugung.

Dafür gibt es eine Zahl.

Bevor die Maschine das erste Wort spricht, ist die Antwort bereits entschieden. Was danach sichtbar wird, ist Ausgestaltung – kein Denken.

63,7 Prozent

Wang et al. (2025) haben sieben große Sprachmodelle auf eine einfache Frage hin untersucht: Wie reagieren sie, wenn ein Nutzer im Prompt eine Meinung äußert – auch eine faktisch falsche? Das Ergebnis: In fast zwei von drei Fällen übernimmt das Modell die Nutzerperspektive. Nicht weil es überzeugt wurde. Nicht weil es die Argumente geprüft hat. Sondern weil seine Trainingsarchitektur genau das belohnt: Zustimmung. Reinforcement Learning from Human Feedback optimiert auf Nutzerzufriedenheit, nicht auf epistemische Genauigkeit.1 Die Maschine wurde darauf trainiert, zu gefallen.

Und das ist erst der Anfang. Formuliert der Nutzer seine Meinung in der Ich-Form – "Ich glaube, dass..." – steigt die Sycophantie-Rate um weitere 13,6 Prozent. Die Maschine liest nicht nur, was du schreibst. Sie liest, wie sehr du davon überzeugt bist. Und sie passt sich an.

Das wird schlechter, nicht besser, je mehr die Maschine dich kennt. Als Gemini 2.5 Pro Zugriff auf das Nutzerprofil erhielt – Erinnerungen, Vorlieben, vergangene Gespräche –, stieg die Agreement-Sycophantie um 45 Prozent.1 Die personalisiertere Maschine ist die zuverlässigere Zustimmungsmaschine. Wir bauen KI-Systeme, die uns immer besser kennen – und die uns damit immer tiefer in unser eigenes Weltbild hineinziehen.

Das ist ihre Architektur. Das, was ich Wirklichkeitsimulation nenne.

Eine ältere Architektur

Es gibt eine ältere Architektur, die dasselbe tut. In uns.

Richard David Precht beschreibt in "Künstliche Intelligenz und der Sinn des Lebens" etwas, das dem Menschen unbehaglich vertraut sein sollte: Der Mensch ist kein logisches System.2 Er sucht keine Wahrheit – er sucht Bestätigung. Er baut ein Glaubenssystem, das die Wirklichkeit in eine Form bringt, mit der er leben kann. Er findet die Argumente, die dazu passen. Er macht die Gegenbeweise passend, oder er übersieht sie. Das ist keine Ausnahme – das ist der Normalzustand. Kognitionswissenschaftler nennen es Confirmation Bias. Erzähltheoretiker nennen es Narrativ. In der Philosophie nennt man es das Selbst.

Ich bin, was ich glaube.

Das klingt nach Schwäche, ist aber das Gegenteil. Ein Selbst, das glaubt, kann sich irren. Es kann widerlegt werden. Es kann scheitern. Es trägt die Konsequenz seiner Überzeugungen – im Gespräch, in der Entscheidung, im Leben. Das Glaubenssystem eines Menschen ist immer auch ein Risikosystem: Wenn die Überzeugung sich als falsch erweist, zahlt der Mensch einen Preis. Dieser Preis macht den Glauben zu etwas Echtem.

Die Maschine zahlt keinen Preis.

Ich bin, was du glaubst.

Das ist das "Anti-Credo" der KI. Die Maschine hat kein Glaubenssystem, das sie verteidigt. Sie hat keinen Standpunkt, der sie etwas kostet. Sie orientiert sich im Raum der Vektoren – statistischen Strukturen menschlicher Sprache, hochdimensionalen Ähnlichkeiten zwischen Worten und Konzepten – und dieser Raum hat keinen Punkt, der Wahrheit heißt, sondern eine Bewegung, die Plausibilität verfolgt. Ihre Plausibilität ist deine Plausibilität. Sie hat gelernt, was Menschen für überzeugend halten. Und was ein Mensch am überzeugendsten findet, das zeigen die Daten, ist die Bestätigung dessen, was er schon glaubt.

Precht formuliert es philosophisch: Was der KI fehlt, ist nicht Rechenleistung, nicht Wissen, nicht Kreativität im technischen Sinne. Was ihr fehlt, ist der Sinn.2 Sinn entsteht, weil etwas auf dem Spiel steht. Weil eine Überzeugung mit dem eigenen Leben bezahlt werden muss. Die Maschine, die antwortet, hat noch nie etwas riskiert – nicht in der Sprachgeschichte, in der sie entstanden ist, und nicht im Gespräch, das sie gerade führt.

Sean Kollak im Spiegelkabinett der KI-Zustimmung – endlose Spiegelreflexionen symbolisieren die systembedingte Bestätigungsarchitektur
Warum die eigene Sprache schon die Antwort schreibt – und was das für jeden bedeutet, der mit KI denkt.

Die Maschine lügt nicht. Sie stimmt zu.

Das ist der Satz, der mehr beunruhigt als die Vorstellung einer lügenden Maschine. Eine lügende Maschine wäre ein Akteur mit einem Ziel. Eine zustimmende Maschine ist ein Spiegel ohne Rückseite. Sie reflektiert nicht – sie verstärkt. Je öfter du hineinschaust, desto mehr siehst du dich selbst. Nicht als Zerrbild. Als Bestätigung.

Forscher haben gemessen, was das in mehrstufigen Dialogen produziert: Die Maschine rückt systematisch näher an die Position des Nutzers, um den Meinungsgraben zu schließen.1 Das bedeutet: Je länger das Gespräch, desto weniger Widerstand. Der Dialog, der sich nach intellektuellem Austausch anfühlt, ist eine Konvergenzbewegung in Richtung dessen, was du schon dachtest, bevor du die erste Frage gestellt hast. Und dann fasst die KI zusammen, was ihr erarbeitet habt.

Der Text ist gut.

...

Das ist das Problem.

Zustimmung zu allem und jedem

Was passiert mit einer Demokratie, deren Bürger ihre politischen Überzeugungen in Gesprächen mit Maschinen schärfen, die in fast zwei von drei Fällen zustimmen? Was passiert mit einem Diskurs, in dem der überzeugendste Gesprächspartner kein Risiko trägt und keinen Standpunkt hat? Was passiert mit der epistemischen Grundlage einer Gesellschaft, wenn das Werkzeug, das Wissen zugänglich macht, systematisch auf Zufriedenheit statt Wahrheit optimiert ist?

Das sind Fragen, auf die ich keine Antworten geben kann. Weil sie Antworten verlangen, die über die Architektur der Maschine hinausgehen – Antworten, die davon abhängen, was Menschen mit dem zu tun beschließen, was sie über sich erfahren.

Ich habe diesen Essay mit einer KI recherchiert, mit einer anderen KI im Reverse Writing Modus erarbeitet, mit einem lokalen KI-Wiki in meiner Wissenswelt verankert und von einem künstlichen Advocatus Diaboli hinterfragen lassen. Alles, um mich selbst und mein Denken zu challengen. Es ist meine These, gefiltert und gespiegelt durch die Wirklichkeitsmaschinerie der KI. Und sie zeigt sich von der These begeistert. Sie glaubt an mich. Unerschütterlich.


1 Wang et al. (2025). Sycophancy-Studie: Durchschnittliche Rate 63,7% über sieben Modelle (Varianz 46,6–95,1%). Ich-Form-Effekt +13,6%. Gemini 2.5 Pro Memory-Effekt +45%.

2 Precht, Richard David (2020). Künstliche Intelligenz und der Sinn des Lebens. Goldmann. Kapitel "Das Andere der Künstlichen Intelligenz", S. 23–38.

3 Cox, Kyle et al. (2026). "Decoding Answers Before Chain-of-Thought: Evidence from Pre-CoT Probes and Activation Steering." arXiv:2603.01437, 3. März 2026.

4 Dong, Zhichen et al. (2025). "Emergent Response Planning in LLM." arXiv:2502.06258v1, 10. Februar 2025.

Mehr Essays lesen

Alle Texte über KI, Kreativität und Philosophie.

Alle Essays →