Terminologie-Forcierung: ein Neologismus der Zukunft

von Mayra Viejo

Nicht nur Sprachspezialisten, sondern auch Laien ist das kostenlose Übersetzungstool DeepL mit seiner Spaltenansicht mit Ausgangs- und Zielsprache bestens bekannt. Seit einiger Zeit steht den Nutzern jedoch eine weitere Funktion zur Verfügung: Ein On-/Off-Button oben rechts mit dem Hinweis «Glossar». Wer darauf klickt, kann bei den Übersetzungen nun festlegen, wie bestimmte Wörter übersetzt werden sollen.

Ein Beispiel: In Ihrem englischen Ausgangstext kommt das Wort «experts» vor. Bei der Übersetzung ins Deutsche wird das Wort «Experten» verwendet. Wollen wir nun, dass DeepL «experts» nicht mit «Experten», sondern mit «Spezialisten» übersetzt, brauchen wir lediglich die gewünschte Terminologie in die Glossar-Funktion einzugeben und DeepL passt die Übersetzung automatisch an.

Terminologie-Forcierung: ein Neologismus mit grossem Potenzial

Unter Computerlinguisten und Sprachtechnologen wird der neuartige Einsatz von fachspezifischer Terminologie «Terminologie-Integration» oder, wie bei TextShuttle, «Terminologie-Forcierung» genannt. DeepL ist somit längst nicht der einzige Anbieter von Maschineller Übersetzung, der diese Technologie zur Verfügung stellt. So hat auch TextShuttle, ein Spin-off-Unternehmen der Universität Zürich, eine Funktion für die Terminologie-Forcierung sowohl in den kundenspezifischen als auch in den generischen MÜ-Engines entwickelt.

Das Besondere dabei ist: Es können nicht nur einzelne Ausdrücke bzw. Benennungen, sondern ganze Terminologiedatenbanken hinterlegt und zusammen mit dem MÜ-System genutzt werden. In anderen Worten: Die Engine wird dazu «forciert», die hochgeladene Terminologie zu verwenden – von daher der Begriff Terminologie-Forcierung.

Language Box hat diese neuartige Funktion getestet.

Unser Test: Terminologie-Forcierung als weiterer Meilenstein?

Das Vorgehen auf der Online-Plattform von TextShuttle ist ziemlich simpel und ähnelt der Glossar-Funktion von DeepL: Hier kann der Kunde selbstständig die gewünschte Terminologie im entsprechenden Feld eingeben und somit die Übersetzung automatisch anpassen lassen. Eine andere Möglichkeit ist, die eigene Terminologiedatenbank als tbx-File hochzuladen, um die Maschine entsprechend zu steuern – mit nur einigen Mausklicks, und ohne dass Hilfe von TextShuttle notwendig wäre. Eine Log-Datei zeigt, ob die tbx-Datei erfolgreich hochgeladen wurde.

Wurde die Terminologiedatenbank bzw. das tbx-File einmal hochgeladen, fügt die Maschine die korrekten Fachbegriffe sogleich auch innerhalb des verwendeten CAT-Tools ein – sofern der Kunde mit einem MÜ-Plug-in von TextShuttle arbeitet, wie es etwa für SDL Trados Studio, Wordbee und Across zur Verfügung steht. Die Anbindung an weitere CAT-Tools ist gemäss TextShuttle auf Anfrage durchaus möglich. Dank dem Plug-in also (d. h. dem Konnektor zwischen dem CAT-Tool und dem MÜ-System von TextShuttle) verwenden die Übersetzer ihre MÜ-Engine direkt im CAT-Tool, so auch die hochgeladene Terminologie.

Die Integration der gewünschten Terminologie via Upload der tbx-Datei in die Maschine sowie das Ergebnis vor, während und nach unserer Testübersetzung (egal, ob online oder innerhalb des CAT-Tools) erachten wir als höchst zufriedenstellend: Definitiv ein weiterer erfolgreicher Meilenstein auf dem Gebiet der neuronalen maschinellen Übersetzung!

Feinschliff und Details: Nur eine Frage der Zeit

Trotz der spürbaren Qualitätssteigerung, die die Terminologie-Forcierung für maschinell übersetzte Texte mit sich bringt, fällt das Post-Editing dennoch nicht weg. Maschine bleibt Maschine – und auch bei einer sauberen und zuverlässigen Terminologie müssen Deklinationen, Pluralformen und weitere sprachspezifische Eigenheiten zum Teil einem letzten humanen Feinschliff unterzogen werden. TextShuttle gibt sich hier jedoch zuversichtlich. Auf die Frage von Language Box etwa, ob die Terminologie-Forcierung in jedem Fall funktioniert, antwortet der Softwarehersteller selbstbewusst:

«Eine hundertprozentige Garantie wird es bei künstlicher Intelligenz nie geben. Jedoch haben wir bis jetzt sehr gute Erfahrungen gemacht und verbessern den Mechanismus laufend.»

Man darf also gespannt sein, wie sich die Terminologie-Forcierung weiterentwickelt. Language Box bleibt am Ball und wird auch in den nächsten Monaten darüber berichten.


Zurück