Warum Mathematik glücklich macht: 151 verblüffende Geschichten (German Edition)
Ausgangssprache suchen wir den wahrscheinlichsten Satz Z in der Zielsprache, den ein guter Übersetzer dem Satz A zugeordnet haben könnte. Wir suchen also jenes Z, für das P(Z/A) maximiert wird. Mit der Bayes’schen Formel aus der Wahrscheinlichkeitstheorie ist
P(Z/A) = P(Z) · P(A/Z)/P(A).
Der Nenner der rechten Seite dieser Gleichung hängt nicht von Z ab, und unsere Aufgabe ist also gleichbedeutend mit der Suche nach dem Satz Z, der das Produkt P(Z) · P(A/Z) maximiert. Der erste Faktor dieses Produktes heißt Language-Wahrscheinlichkeit. Der zweite Faktor heißt Übersetzungs-Wahrscheinlichkeit. Gröblich gesprochen, kann man sich vorstellen, dass die Übersetzungs-Wahrscheinlichkeit Worte in der Zielsprache vorschlägt, welche den Worten, die im Satz der Ausgangssprache vorkommen, zugeordnet sein könnten. Die Language-Wahrscheinlichkeit schlägt dann eine Reihenfolge für diese Worte aus der Zielsprache vor.
Ein stochastisches Übersetzungssystem erfordert also eine Methode, um Language-Wahrscheinlichkeiten auszurechnen, und eine Methode, um Übersetzungs-Wahrscheinlichkeiten auszurechnen.
Sowohl die Language-Wahrscheinlichkeiten als auch die Übersetzungs-Wahrscheinlichkeiten werden aus dem großen Reservoir an Paralleltext geschätzt. Für die Language-Wahrscheinlichkeiten ist das direkt möglich. Bei ihnen geht das so: Angenommen, wir haben einen String Z von Worten, also Z = z 1 … z n , dann können wir dessen Wahrscheinlichkeit wie folgt berechnen, abermals durch wiederholte Anwendung der Bayes-Formel:
Demzufolge besteht das Problem der Modellierung der Language-Wahrscheinlichkeit darin, die Wahrscheinlichkeit eines einzelnen Wortes in einem Satz der Zielsprache zu berechnen, wenn diesem Wort ein gegebener String von Worten vorausgeht. Wir benötigen also bedingte Wahrscheinlichkeiten vom Typ P(z m /z 1 … z m-1 ) nebst den unbedingten Wahrscheinlichkeiten der Worte P(z 1 ).
Die Übersetzungs-Wahrscheinlichkeit P(A/Z) stellt den eigentlichen Zusammenhang zwischen Ausgangssprache und Zielsprache her, speziell zwischen den Wortfolgen A = a 1 … a m und Z = z 1 … z n . Um den unterschiedlichen Wortpositionen in Ausgangs- und Zielsatz Rechnung zu tragen, werden so genannte Alignments R = r 1 … r j … r m als Variablen der Wortreihung eingeführt. Dann wird das Wort aj des Ausgangssatzes auf das Wort z i in der Position i = r j im Zielsatz abgebildet. Mit Hilfe der Alignments wird die Übersetzungs-Wahrscheinlichkeit folgendermaßen zerlegt:
Diese Darstellung enthält ein Alignment-Modell P(R/Z) und ein Lexikon-Modell P(A/R∩Z). Das Erstere erfasst allein die Reihenfolge der Worte des Satzes Z, das Zweite die Übersetzung der Worte in einer gegebenen Reihenfolge R Beide Wahrscheinlichkeiten werden dann direkt aus der eingespeicherten Kollektion von Paralleltext geschätzt. Auf diese Weise können Computer Texte übersetzen, ohne sie zu verstehen, nicht besserwisser-, aber bessersprecherisch. Und das ist der gegenwärtige Übersetzungsolymp, jedenfalls auf dem Gebiet computerisierter Übersetzungen.
Quasi dasselbe mit anderen Worten: Übersetzung als Approximation
Folge 1: Unübersetzbares. Auch jede Übersetzung ist nur eine Approximation, und zwar an den mit der Ausgangssprache ausgedrückten Sinngehalt des Textes. Das kann mal besser und mal schlechter gelingen. Hier eine beispielhafte Übersetzung, die mir im Gedächtnis geblieben ist.
Als der sowjetische Staats- und Parteichef Michail Gorbatschow, damals Noch-Präsident der Noch-Sowjetunion, einst in Bonn zu einem Besuch weilte, erzählte ihm der damalige Bundeskanzler Helmut Kohl: «Morgen ist hier Feiertag, nämlich Christi Himmelfahrt», was der russische Dolmetscher folgendermaβen übersetzte: «Morgen arbeiten die Deutschen nicht, denn sie feiern den Tag der Luftwaffe.» Der Versuch einer russischen Approximation für Christi Himmelfahrt.
Folge 2: Goethe über Bande. Ein Goethe-Experte übersetzte 1902 dessen bekanntes Gedicht von 1776, Wanderers Nachtlied:
Über allen Gipfeln ist Ruh,
In allen Wipfeln spürest du
Kaum einen Hauch.
Die Vöglein schweigen im Walde.
Warte nur, balde
Ruhest du auch.
ins Japanische. Ein französischer Verehrer japanischer Lyrik übertrug die schönen Verse 1911 ins Französische. Worauf sie am Ende dieser poetischen Irrfahrt ein deutscher Nachdichter fernöstlicher Lyrik wieder ins Deutsche übertrug, ohne zu ahnen, dass sie ursprünglich von Goethe stammen. Eine Literaturzeitschrift druckte die
Weitere Kostenlose Bücher