22.04.2026 | Lesezeit: ca. 7 Minuten

KI-Halluzinationen erkennen — der Fact-Check-Workflow

Wenn die KI Quellen erfindet

Roboter schreibt Zettel, eine Lupe und grünes Häkchen prüfen das Geschriebene

Ein Kunde übernahm letzte Woche ein Buchzitat aus ChatGPT direkt in sein Angebot. Die KI hatte prompt geliefert: „nach Müller, Digitale Geschäftsmodelle 2023, ISBN 978-3-…". Drei Tage später kam der Anruf. Das Buch existiert nicht. Auch die ISBN nicht. Auch nicht der Autor.

Der erste Reflex ist Scham, der zweite Misstrauen gegen das ganze Tool. Beides ist verständlich, beides hilft nicht weiter. KI-Modelle erfinden nicht aus Bosheit. Sie tun es strukturell, weil sie das Wahrscheinliche generieren, nicht das Wahre. Wer das verstanden hat, schaltet vom Schreckensmodus in den Routinemodus um. Halluzinationen sind dabei nur ein Teil davon, die Grenzen der KI realistisch einzuschätzen, statt dem Werkzeug blind zu vertrauen.

Dieser Beitrag zeigt Dir, wie Halluzinationen entstehen, an welchen sieben Signalen Du sie erkennst und wie ein Fact-Check-Workflow in drei Schritten in den Alltag passt. Plus eine kurze Liste, welche Aufgaben Du der KI besser gar nicht erst stellst.

Was eine KI-Halluzination wirklich ist

Sprachmodelle wie ChatGPT, Claude oder Gemini berechnen Wahrscheinlichkeiten für das nächste Wort. Sie haben kein internes Konzept von „stimmt das". Sie produzieren das, was zu Deiner Frage passend klingt. Eine Halluzination ist also eine plausibel formulierte Aussage, die zufällig oder strukturell von der Realität abweicht, ohne bewusste Täuschung.

Klassiker sind erfundene Quellen, falsche Jahreszahlen, halb wahre Details über lebende Personen und konkrete Zahlen ohne Beleg. Die Trainingsdaten haben Lücken. Das Kontextfenster ist begrenzt. Je länger eine Konversation läuft, desto schwächer wird der Bezug zur ursprünglichen Frage. Auch Retrieval-Augmented-Generation, also das Nachschlagen in echten Dokumenten zur Antwort-Zeit, senkt die Halluzinations-Quote. Eliminieren tut sie das nicht.

Die Pointe: Die Modelle werden besser, aber das Phänomen verschwindet nicht. Mit einem präzise formulierten Prompt reduzierst Du das Risiko, weil Du den Spielraum für freies Erfinden einschränkst. Der Check bleibt trotzdem nötig.

Sieben Warnsignale, an denen Du sie erkennst

Halluzinationen verraten sich oft durch ihre eigene Glätte. Sieben Muster, auf die Du achten kannst:

  1. Zu glatt formuliert: Die Antwort liest sich wie aus einem Lehrbuch, ohne ein einziges „möglicherweise" oder „je nach". Echte Sachverhalte haben Kanten. KI-Erfindungen sind oft zu rund.
  2. Quelle aus dem Kopf zitiert ohne Link: „laut einer Studie von …" und keine URL, kein Verweis auf eine Datenbank. Wenn die KI eine Quelle kennt, kann sie sie meist auch benennen.
  3. Buch- oder Studien-Zitat ohne ISBN oder DOI: Wenn das Werk nicht prüfbar ist, ist es vermutlich erfunden. Gerade ISBN-Nummern werden gerne aus dem Schema heraus halluziniert.
  4. Konkrete Zahlen ohne Quelle: „72,3 Prozent der Selbständigen …" klingt sachlich exakt, ist oft fabriziert. Je dezimaler die Nachkommastelle, desto höher der Verdacht.
  5. Aussagen über lebende Personen: Halb-Wahrheiten, Verwechslungen und falsche Funktionen sind hier Standard. Auch Geburtsorte, Werdegänge und Zitate werden routiniert vermischt.
  6. Aktualitätsbehauptungen: „Stand 2026" sagt nichts über den tatsächlichen Trainings-Cutoff. Modelle datieren ihre Antworten auf das aktuelle Jahr, auch wenn die Daten Jahre alt sind. Wie Du den Stichtag eines Modells herausfindest und die Lücke gezielt schließt, ist die andere Ursache veralteter Antworten neben der Halluzination.
  7. Antwort widerspricht Deinem Bauchgefühl: Du hast ein vages Gefühl, dass etwas nicht stimmt. Du übernimmst trotzdem, weil die KI selbstbewusst formuliert. Genau dann lohnt sich der Check.

Selbstbewusstsein ist kein Wahrheitsbeweis. Neben dem freien Erfinden lohnt auch ein Blick auf KI-Bias und Verzerrungen, die sich leiser in scheinbar saubere Antworten schleichen. Eine KI kann sehr überzeugend daneben liegen, gerade wenn sie keine Quelle nennt.

Der Fact-Check-Workflow in drei Schritten

Wenn Du einen Halluzinations-Verdacht hast, lohnt sich eine kleine Routine. Das gilt erst recht, wenn die Aussage in einem Angebot, einem Vertrag oder einer Veröffentlichung landet. Drei Schritte, zusammen meist zwei bis drei Minuten.

  1. Triangulieren. Stelle dieselbe Frage in zwei unabhängigen Quellen, etwa Google plus Wikipedia oder Google plus Original-Webseite. Wenn die Aussagen sich decken, bist Du auf der sicheren Seite. Wenn nicht, verwirfst Du die KI-Antwort und arbeitest mit dem, was Du gefunden hast.
  2. Quellen einzeln googeln. Jeden konkreten Fakt (Jahreszahl, Name, Zitat, ISBN) als kurze Suchphrase prüfen. Liefert Google null Treffer für ein angebliches Zitat, ist es vermutlich erfunden. Bei einer ISBN reichen zehn Sekunden im Buchhandels-Katalog, um die Existenz zu bestätigen.
  3. Original prüfen. Übernimm den ersten Treffer nicht ungeprüft und arbeite Dich zur Primärquelle vor: Gesetzestext statt Anwaltsblog, Pressemitteilung statt Newsticker, Hersteller-Doku statt Forenbeitrag. Sekundärquellen erben Fehler, die Du sonst weiterträgst.

Der Aufwand ist niedriger als das Risiko, eine falsche Aussage in einem Angebot oder einer Rechnung zu zitieren. Wenn Du tiefer einsteigen willst, wie KI-gestützte Recherche überhaupt funktioniert und wo sie endet, hilft der Beitrag Stärken nutzen, Grenzen kennen beim Einordnen.

Wofür Du die KI besser gar nicht erst nutzt

Manche Aufgaben sind Halluzinations-Magneten. Das liegt weniger daran, dass die KI hier zwingend lügt, sondern am ungünstigen Risiko-Nutzen-Verhältnis. Eine falsche Steuer-Auskunft kostet mehr, als Du beim Schreiben gewinnst.

  • Recht: BGB-Paragrafen, Steuern, Vertrags-Formulierungen. Paragrafen werden routiniert verwechselt oder erfunden.
  • Medizin: Diagnose-Vorschläge, Dosierungen, Wechselwirkungen. Hier zählt jede Zahl.
  • Aktuelle Daten: Börsenkurse, Wahlergebnisse, Wetter, Sportstände. Trainings-Cutoff ist immer älter als das angezeigte Datum.
  • Lebende Personen: Biografien, Zitate, Funktionen, persönliche Details. Verwechslungen sind die Norm, nicht die Ausnahme.
  • Produktiver Code ohne Test: Funktioniert das Snippet wirklich oder sieht es nur richtig aus? Ohne Ausführen kannst Du es nicht beurteilen.
  • Alles mit rechtlichen oder finanziellen Konsequenzen: Wenn der Schaden bei einer falschen Aussage größer ist als der Zeitgewinn, ist KI das falsche Werkzeug.

Daneben gibt es eine zweite Klasse von Inhalten, die Du ohnehin nicht in eine Cloud-KI eingibst: personenbezogene Daten, Geschäftsgeheimnisse, Vertragsentwürfe. Welche Daten dort tabu sind und warum, klärt der Beitrag die andere Klasse von Daten, die Du besser nicht eingibst. Datenhygiene und Halluzinations-Vorsicht bilden zusammen die operative Schwelle für KI im Alltag.

Wofür sie zuverlässig gut ist

So wichtig die Vorsicht ist, die KI hat klare Stärken. Es lohnt sich, die nicht aus den Augen zu verlieren. Halluzinations-Risiko ist immer dann niedrig, wenn entweder kein Wahrheitsanspruch existiert oder die Quelle vom Nutzer kommt.

  • Brainstorming und Strukturierung: Ideen für eine Landingpage, Gliederung für einen Vortrag, mögliche Argumente in einer Diskussion. Hier zählt Spielraum, nicht Wahrheit.
  • Übersetzungen und Umformulierungen: Du kennst den Ausgangstext und kannst beurteilen, ob die Übertragung sinnt. Halluzinationen werden sofort sichtbar.
  • Code-Skelette: Gerüst für eine Funktion, Boilerplate für ein neues Skript. Anschließend testen, dann übernehmen.
  • Erklärung allgemeiner Konzepte: Wie funktioniert ein Lastenheft, was ist DNS, wie liest man eine Bilanz. Das ist breit dokumentiertes Wissen, dort ist die Quote niedrig.
  • Zusammenfassung eingegebener Texte: Wenn Du den Quelltext mitlieferst, hat die KI keine Lücke zu füllen. Sie verdichtet, erfindet aber selten dazu.

Die Faustregel: Je mehr Kontext Du selbst lieferst, desto kleiner der Spielraum für freies Erfinden. Und desto größer der Nutzen.

Eine Faustregel für den Alltag

Du musst nicht jede Antwort durch den vollständigen Workflow schicken. Die Frage ist immer: Was passiert, wenn diese Aussage gleich falsch ist? Bei einer locker formulierten internen Notiz reicht ein Blick. Bei einer Klausel im Angebot, einer Zahl in der Rechnung oder einem Zitat in einer Veröffentlichung gehst Du den Drei-Schritt-Check durch.

Eine kompakte Daumenregel: Wenn die Antwort Fakten enthält (Zahlen, Namen, Jahre, Paragrafen, Zitate) und diese Fakten irgendwo nach außen wandern, dann Fact-Check. Wenn die Antwort nur Struktur, Sprache oder Idee liefert, übernimmst Du, prüfst und arbeitest weiter.

Die zweite Verteidigungslinie liegt im Prompt selbst. Klare Anweisungen, explizite Quellen-Wünsche und der Hinweis „antworte mit ‚ich weiß es nicht', wenn Du unsicher bist" senken die Halluzinations-Quote messbar. Wie das in der Praxis aussieht, vertieft der Beitrag bessere Prompts schreiben. Bessere Prompts ersetzen den Check nicht, machen ihn aber seltener nötig.

Fazit — Misstrauen wird Routine

KI-Halluzinationen verschwinden nicht. Sie sind kein Bug, den irgendein Anbieter im nächsten Update behebt. Sie sind die strukturelle Folge davon, wie Sprachmodelle aufgebaut sind. Wer das akzeptiert, hört auf, sich zu wundern, und baut sich stattdessen eine kleine Routine. Drei Schritte, zwei Minuten, der Workflow läuft im Hintergrund mit.

Damit hast Du einen strategischen Vorteil. Die meisten Nutzer überspringen den Schritt und geben Halluzinationen ungeprüft weiter. Du nicht.