Der Aufstieg der generativen künstlichen Intelligenz (KI) hat die Welt im Sturm erobert und findet sowohl im privaten als auch im beruflichen Bereich Anwendung. In der Untertitelungsbranche kann KI im Prozess der automatischen Spracherkennung (ASR) eingesetzt werden, die Sprache in Text umwandelt. Obwohl die ASR-Technologie noch nie so fortschrittlich war wie heute, zeigen unsere Untersuchungen, dass selbst die besten Maschinen unter dem Industriestandard liegen. Das bedeutet, dass der Mensch nach wie vor eine wichtige Stütze bei der Erstellung hochwertiger, verständlicher Untertitel ist.
DIE GENAUIGKEIT VON AUTOMATISCHEN UNTERTITELN
In der Welt der Untertitel werden Genauigkeitsraten verwendet, um die Präzision und Qualität einer Untertiteldatei, einer Untertiteldatei oder einer Abschrift zu messen. Da die Genauigkeit von entscheidender Bedeutung ist, um gehörlosen und schwerhörigen Zuschauern wirklich gerecht zu werden, liegt der Industriestandard für die Mindestgenauigkeit von Untertiteln bei 99 %. Aber was bedeutet das wirklich?
Bei der Messung der Genauigkeit einer ASR-Engine gibt es eine Reihe von Faktoren zu berücksichtigen. Wie von der FCC dargelegt, müssen "korrekte Untertitel den Tonfall des Sprechers und die Absicht des Inhalts vermitteln". Korrekte Rechtschreibung, Abstände, Großschreibung und Zeichensetzung sind Schlüsselelemente für korrekte Untertitel, ebenso wie nichtsprachliche Elemente wie Soundeffekte und Sprecherkennungen.
Da ASR-Engines durch künstliche Intelligenz gesteuert werden, sind ihre Fähigkeiten auf das beschränkt, was ihnen durch ihre Programmierung beigebracht wurde. Trotz ständiger Fortschritte verfügt die KI-gestützte Technologie nicht über die gleiche Fähigkeit zur Logik oder zum Verständnis von Zusammenhängen wie ein Mensch. In der Praxis kann der ausschließliche Einsatz von KI bei der Transkription/Untertitelung zu Rechtschreibfehlern und Ungereimtheiten führen, die ein menschlicher Untertitler nicht hätte.
Im Bericht 2024 von 3Play Media über den Stand der automatischen Spracherkennung wurden die Leistung und Genauigkeit von 10 Engines bei der Untertitelung und Transkription von aufgezeichneten Inhalten bewertet.
Wir haben herausgefunden, dass einige Engines für bestimmte Inhalte besser geeignet sind (z. B. für Bildungsinhalte und nicht für Kinofilme), was die möglichen Anwendungsfälle für automatische Untertitel noch differenzierter macht. Aber insgesamt lieferte keine von 10 Maschinen eine Ausgabe mit einer Genauigkeit von über 95 %, wenn man die Wortfehlerrate (WER) betrachtet. Wenn wir dieselbe Metrik zur Analyse der Genauigkeit nach Inhaltstyp verwenden, sehen wir ein Spektrum von Ergebnissen. Während die WER auf dem Markt für Waren und Dienstleistungen relativ niedrig ist, verdoppelt sie sich fast auf dem technischen Markt.
Die Diskrepanz zwischen den verschiedenen Arten von Brancheninhalten zeigt, dass die ASR-Technologie noch nicht ausreicht, um barrierefreie Untertitel zu erstellen. Letztlich bietet ein menschlicher Ansatz bei der Untertitelung das größte Potenzial für eine hochpräzise Ausgabe.
DIE AUSWIRKUNGEN DER UNGENAUIGKEIT DER AUTOMATISCHEN UNTERTITELUNG
Die Auswirkungen von ungenauen Untertiteln können weiter reichen, als Sie denken. Menschen mit Behinderungen und ihre Familien verfügen über eine Kaufkraft in Milliardenhöhe, aber ihre Bereitschaft, Geld auszugeben, sinkt erheblich, wenn Online-Erlebnisse unzugänglich sind. Der WebAIM-Millionenbericht 2023 stellt fest, dass über 96 % der Webseiten nicht barrierefrei sind, was eine echte Lücke in den potenziellen Einnahmequellen darstellt.
Qualitativ minderwertige Untertitel machen Inhalte nicht nur unzugänglich, sondern können sich auch negativ auf die Nutzererfahrung insgesamt auswirken. Die Einschränkungen von ASR machen ihre Transkripte anfälliger für Ersetzungsfehler, Halluzinationen (Text ohne Audiobasis) und Formatierungsfehler - wasIhr Publikum und den Algorithmus verwirren kann. Außerdem wirken sich Videotranskripte auf die Suchmaschinenoptimierung aus, die ein wesentlicher Aspekt vieler Markenmarketingstrategien ist.
Suchmaschinen verlassen sich auf den mit dem Videoinhalt verknüpften Text, um die Ergebnisse zu indizieren und entsprechend einzustufen. Daher gehören Transkripte und Untertitel-Dateien zu den wichtigsten Faktoren für die Keyword-Dichte einer Website und für die Platzierung in den Suchergebnissen. Wenn sich Ihre Marke ausschließlich auf automatisch generierte Untertitel und Transkripte verlässt, können Fehler Ihre Suchstrategie zunichte machen. Falsche Langform-Abfragen und Schlüsselwörter schaffen eine Trennung zwischen Ihnen, Ihrer Zielgruppe und deren Engagement-Potenzial.
Abgesehen von den technischen Nachteilen stellt eine schlechte Qualität der Bildunterschriften Ihre gesamte Marke in Frage. Im Vereinigten Königreich geben 59 % der Verbraucher an, dass Rechtschreibfehler und schlechte Grammatik sie an der Qualität der angebotenen Dienstleistungen zweifeln lassen. Mit anderen Worten, ungenaue Bildunterschriften untergraben Ihre Marketingbemühungen und schwächen das Vertrauen Ihres Publikums.
WIE MAN AUTOMATISCHE UNTERTITEL SINNVOLL EINSETZT
Künstliche Intelligenz ist ein unverzichtbares Werkzeug für die effiziente Erstellung von automatischen Untertiteln in großem Umfang. ASR-generierte Transkripte rationalisieren die Untertitelerstellung, indem sie einen grundlegenden ersten Schritt für die Überprüfung durch menschliche Redakteure darstellen. Dadurch entfällt die Notwendigkeit der manuellen Timecode-Zuordnung, die in der Regel der zeitaufwändigste Teil der Untertitelerstellung ist. Die Kombination aus professionellen menschlichen Transkriptionisten und Technologie sorgt also für einen effizienteren Qualitätssicherungsprozess und hält gleichzeitig die Kosten für die Kunden niedrig.
Das patentierte Verfahren von 3Play erstellt hochpräzise Transkripte und Dienste für die Barrierefreiheit von Medien. Dabei werden neben der Spitzentechnologie auch menschliche Fachkräfte eingesetzt, um eine durchschnittliche Messgenauigkeit von 99,6 % zu gewährleisten. Um die Zugänglichkeit von Videos zu vereinfachen, integrieren wir sie in beliebte Videoplattformen wie Brightcove, damit sie dort funktionieren, wo Sie sie bereits nutzen. Die Integration von 3Play und Brightcove macht nicht nur Inhalte zugänglich und sorgt für die Einhaltung von Vorschriften, sondern steigert auch den Wert Ihrer Videoinvestitionen mit einem Klick.