„Wie ein schönes langsames Tierleben“: Was KI-Dolmetschkopfhörer können und was nicht
“Wie ein schönes langsames Tierleben.” Dieser Satz fiel während meines Tests von KI-Dolmetsch-Kopfhörern in der RBB-Sendung „Live-Übersetzung im Check“. Das Problem? Niemand hatte ihn gesagt. Die künstliche Intelligenz hatte ihn einfach… erfunden. Halluziniert. Aus dem Nichts.
Was bei der Reporterin, Laura Sophie Wolf, und mir für Lacher sorgte, wirft jedoch eine ernste Frage auf: Wie zuverlässig sind diese neuen Technologien wirklich? Ich durfte beim ARD-„Marktcheck“-Praxistest dabei sein. Getestet wurden dabei die AirPods Pro 3 „Magie“ von Apple, die Kopfhörer von Timekettle und ein preiswerter Amazon-Beststeller.
Der Praxistest: Zwei Szenarien, viele Überraschungen
Ausprobiert wurden die verschiedenen Kopfhörer in zwei Alltagssituationen: einmal bei einer Stadtführung am Brandenburger Tor und einmal bei Gesprächen in einer ruhigeren Umgebung.
Teil 1: Vom „Brandenburger Tor“ zum „Markenbuch“
Für den ersten Test trafen wir uns direkt im Herzen von Berlin, am Brandenburger Tor. Während Gregor, unser englischsprachiger Tourguide, einer Touristengruppe anhand der verschiedenen Wahrzeichen der Stadt die Geschichte Berlins näherbrachte, sollten die verschiedenen KI-Kopfhörer-Modelle ihre Fähigkeiten unter Beweis stellen.
Berlin zeigte sich dabei von seiner besten Seite: vorbeifahrende Autos, plappernde Touristengruppen und Wind, der ins Mikrofon pustete. Hier wurde es für die KI-Kopfhörer schwierig. Ganze Satzteile gingen in den Umgebungsgeräuschen verloren oder wurden missverstanden. So wurde das „Brandenburger Tor“ aus unerklärlichen Gründen plötzlich zu „Markenbuch“.
Doch auch in ruhigeren Ecken fiel es als Zuhörerin oft schwer, der KI zu folgen, gerade wenn Nuancen und Kontext entscheidend waren oder ein Sprecherwechsel stattfand. Auch von Gregors lebhafter Führung und seinen ironischen Bemerkungen blieb oftmals nicht so viel übrig. Besonders problematisch aber war die Verzögerung, also das, was wir als Dolmetscherinnen als „décalage“ bezeichnen. Während wir unser Bestes geben, nur kurz nach der sprechenden Person auch unseren Satz zu beenden, hinkte die KI-Audioausgabe dem Original so stark hinterher, dass wir noch den verdolmetschten Erklärungen zur Quadriga lauschten, während Gregor sich schon längst den dorischen Säulen zugewandt hatte. Insgesamt also eher ein etwas frustrierendes Erlebnis. Daher lag es nahe, das Ganze nochmal in einer Umgebung mit weniger Hintergrundgeräuschen zu testen.
Teil 2: Von „climate“ zu „chinesisch“
Wir wechselten also zu einer ruhigeren Location: einem Co-Working-Space, in dem die Interviewpartner auf Englisch und in anderen Sprachen befragt wurden. Ohne die vorherigen Störgeräusche wirkte es anfangs so, als funktioniere die KI tatsächlich besser. Viele Wörter wurden korrekt erkannt und einige einfache Sätze auch vollständig übertragen. Doch auch hier schlichen sich immer wieder Fehler ein. Aus „climate tech startups“ im englischen Original wurde in der KI-Verdolmetschung auf einmal „chinesische Tech-Startups“. Bei einem solchen Fehler würde im echten Leben so manches Gespräch eine ganz andere Richtung nehmen. Denn während menschliche Dolmetscher mitten im Satz oder auch auch danach noch nachjustieren können, ist eine solche Flexibilität bei der KI nicht gegeben. Hat sie sich einmal festgelegt, gibt es keine Korrektur, ganz egal, wie falsch sie damit liegt. Und sobald ein Satz von der sprechenden Person nicht sofort beendet wurde, sondern diese kurz zögerte, bevor sie fortfuhr, kam die KI ins Schleudern. Sie setzte einfach selbständig einen Punkt und machte mit dem verzögert geäußerten Satzteil einen neuen Satz auf. Da musste man als Zuhörerin schon sehr gut hinhören, um diese Problematik a) zu erkennen und b) dann die gehörte Verdolmetschung für sich neu zu sortieren.
Doch auch andere Schwächen kamen nun zum Vorschein. Die Verzögerung war immer noch deutlich spürbar und wurde im Laufe des Gespräches sogar immer länger. An eine Verdolmetschung einer Podiumsdiskussion mit wechselnden Redner:innen wäre also gar nicht zu denken. Je komplexer die Unterhaltung wurde, desto mehr geriet die KI ins Stocken. Plötzlich tauchten Wörter und Satzteile auf, die niemand gesagt hatte, die sogenannten Halluzinationen. Die KI erfand Informationen dazu, füllte Lücken mit eigenen “Interpretationen“ – darunter auch das mittlerweile berühmt-berüchtigte „Wie ein schönes langsames Tierleben”.
Was lustig klingt, kann in der Praxis verheerende Konsequenzen haben. Eine Studie der Weltgesundheitsorganisation zum Einsatz von KI-Verdolmetschungen hat gezeigt, wie groß das Reputationsrisiko durch die Übersetzungsfehler der KI sein kann, von falsch übertragenen Eigennamen über nicht korrekte Fachbegriffe bis hin zu Fehlern bei Zahlen und Daten. Dazu zählen auch immer wieder auftretende Mängel, weil die KI blind für den Kontext ist (z.B. „Frau Vorsitzende“, obwohl es sich um einen Mann handelt). Und nicht zu vergessen – wie auch in der Reportage angesprochen – ist und bleibt natürlich das Thema Datenschutz: Während wir als Dolmetscherinnen strengen Vertraulichkeitsregelungen unterliegen, die die Grundvoraussetzung für die langfristige Zusammenarbeit mit unseren Kund:innen darstellen, besteht bei KI-Systemen die Gefahr von Manipulation, Cyberangriffen oder Datenlecks.
Mein Fazit nach dem Test
Ist man auf Reisen in einem anderssprachigen Land und möchte nach dem Weg fragen oder in einem Restaurant etwas bestellen, kann ein KI-Dolmetsch-Kopfhörer vielleicht hilfreich sein. Doch bei Verhandlungen in Politik und Wirtschaft, Pressekonferenzen, Podiumsdiskussionen oder Delegationsbesuchen ist weit mehr gefragt als nur die Übertragung von einzelnen Wörtern in eine andere Sprache.
Es braucht:
- Kontextverständnis– Was ist wirklich gemeint?
- Kulturelle Kompetenz– Wie werden Sachverhalte in dieser Kultur ausgedrückt?
- Spontane Anpassungsfähigkeit– Wie reagiere ich auf Unvorhergesehenes?
- Verlässlichkeit– Keine Halluzinationen, kein Raten
- Echtzeitfähigkeit– Ohne störende Verzögerung
Die Technik ist also durchaus beeindruckend, aber den menschlichen Faktor kann sie nicht ersetzen.
