23.05.2026 | Lesezeit: ca. 4 Minuten

Untertitel und Transkripte — Medien für alle

Zwei Spuren öffnen jedes Medium

Ein Videoplayer mit Untertitel-Balken, Schallwellen und einem Transkript-Band

In der Bahn läuft ein Video, der Ton bleibt aus. Wer mitlesen kann, schaut zu Ende. Wer auf den Ton angewiesen ist, scrollt weiter. Genau hier entscheidet sich, ob ein Medium für alle offen ist oder nur für die, die gerade hören und sehen können.

Untertitel und Transkripte sind die zweite Spur, die ein Video oder einen Podcast zugänglich macht. Die gute Nachricht: Der Aufwand ist überschaubar, und die Mühe zahlt sich doppelt aus. Dieser Beitrag zeigt Dir, wer diese Spuren braucht, wie Du Untertitel richtig anlegst, wann ein Transkript der bessere Weg ist und was Audiodeskription leistet.

Wer Untertitel und Transkripte braucht

Der offensichtliche Grund sind gehörlose und schwerhörige Menschen. Für sie ist der Ton schlicht nicht da. Ein Video ohne Textspur bleibt eine Tonne mit verschlossenem Deckel: Es sieht voll aus, der Inhalt kommt aber nicht an.

Der weniger offensichtliche Grund: Fast jeder liest situativ mit. Im Großraumbüro ohne Kopfhörer, in der vollen Bahn, neben dem schlafenden Kind. Wer eine Sprache gerade lernt, hängt sich an die geschriebene Zeile, weil das Ohr noch nicht schnell genug folgt. Und wer Dein Video in lauter Umgebung öffnet, bleibt nur dran, wenn er den Faden auch ohne Ton mitlesen kann.

Dazu kommt ein technischer Mitleser: die Suchmaschine. Google hört kein Video und keinen Podcast, aber es liest Text. Ein Transkript macht den gesprochenen Inhalt überhaupt erst auffindbar. Untertitel und Transkripte helfen also einer klar benannten Gruppe und nebenbei allen anderen.

Untertitel richtig machen

Untertitel laufen synchron zum Ton mit und geben das Gesprochene als Text wieder. Drei Dinge entscheiden, ob sie taugen: Timing, Lesbarkeit und Korrektheit.

Synchron: Die Zeile erscheint, wenn das Wort fällt, und verschwindet, bevor die nächste sie überholt. Untertitel, die dem Ton hinterherhinken, stiften mehr Verwirrung als Hilfe.

Lesbar: Maximal zwei Zeilen gleichzeitig, lieber kurze Sinneinheiten als ein gepresster Bandwurm. Wer eine Zeile nicht in der Standzeit liest, hat sie verloren.

Korrekt: Namen, Fachbegriffe und Zahlen müssen stimmen. Hier liegt die größte Falle. Automatische Untertitel von YouTube oder einem Editor sind ein guter Rohentwurf, aber kein fertiges Produkt.

Die typischen Fehler wiederholen sich: Aus „Mehl" wird „mehr", aus der Wortmarke „TYPO3" wird „Tüpo drei", eine Telefonnummer läuft als ungebremster Zahlenstrom durch. Auch den Wechsel zwischen zwei Sprechern erkennt die Automatik nicht, also klebt im Interview die Antwort an der Frage, ohne dass klar wird, wer gerade redet.

Die Regel ist einfach: Auto-Untertitel erzeugen, dann Zeile für Zeile durchgehen und korrigieren — Sprecherwechsel markieren, Satzzeichen setzen, lange Zahlen in lesbare Blöcke zerlegen. Diese halbe Stunde trennt einen ernst gemeinten Untertitel von einer peinlichen Pannenschau. Schreib die Untertitel außerdem so klar und einfach, wie Du auch Fließtext schreibst.

Transkripte für Podcasts und Audio

Ein Podcast hat kein Bild, an dem ein Untertitel kleben könnte. Hier ist das Transkript das passende Werkzeug: der vollständige Text des Gesprochenen, sichtbar unter dem Player.

Für gehörlose Menschen ist das Transkript der einzige Zugang zu einer reinen Audio-Folge. Aber auch hörende Besucher greifen oft lieber zum Text. Wer eine bestimmte Stelle sucht, überfliegt das Transkript in Sekunden, statt sich durch vierzig Minuten Audio zu spulen.

Ein Transkript wird im Alltag erstaunlich oft genutzt. Jemand zitiert daraus eine Aussage korrekt, statt sie nach Gehör abzutippen. Ein Leser verlinkt eine einzelne Passage, weil sie genau seinen Punkt trifft. Und Du selbst verwertest den Text später als Blogbeitrag oder Shownotes weiter.

Ein Transkript muss kein wörtliches Protokoll jedes „ähm" sein. Geglättet, in Absätze gegliedert und mit Sprecher-Hinweisen versehen liest es sich am besten. Der Nebeneffekt ist handfest: Der Volltext gibt Suchmaschinen etwas zu indexieren, und Deine Folge wird über genau die Worte findbar, die darin fallen.

Audiodeskription kurz erklärt

Untertitel und Transkripte decken den Ton ab. Es bleibt der umgekehrte Fall: ein blinder Mensch hört zwar alles, sieht aber nicht, was im Bild passiert. Genau diese Lücke füllt die Audiodeskription.

Audiodeskription ist eine zusätzliche Tonspur, die das Wichtige im Bild beschreibt, in den Sprechpausen der Handlung. Ein kurzes „Sie öffnet den Brief und erstarrt" trägt die Geschichte für jemanden, der den Bildschirm nicht sieht.

Wie schnell die Lücke entsteht, zeigt ein Tutorial, das nur „und dann klickst Du genau hier" sagt. Wer nicht sieht, wohin „hier" zeigt, ist raus. Ein Satz wie „klick oben rechts auf Speichern" macht denselben Schritt für alle nachvollziehbar.

Für die meisten kleinen Webseiten ist eine eigene Spur selten nötig. Ein Erklärvideo, in dem die Stimme ohnehin beschreibt, was zu sehen ist, braucht keine. Wichtig wird Audiodeskription dort, wo entscheidende Information nur im Bild steht und nicht ausgesprochen wird. Im Zweifel hilft schon, beim Skript laut zu denken, statt stumm auf den Bildschirm zu zeigen.

Fazit

Video und Audio sind keine geschlossenen Medien, wenn Du die zweite Spur mitdenkst. Untertitel öffnen das Video, Transkripte den Podcast, Audiodeskription das rein Visuelle.

Der größte Hebel ist der billigste: korrigierte Untertitel statt ungeprüfter Automatik und ein Transkript unter jeder Audio-Folge. Wer das von Anfang an einplant, denkt Barrierefreiheit nicht nach, sondern mit. Wie das ins große Bild passt, zeigen die WCAG-Grundlagen, und wer wirklich dazu verpflichtet ist, klärt der Beitrag zum BFSG.