Warum Mathematik glücklich macht: 151 verblüffende Geschichten (German Edition)
von Paralleltext. Aus dieser Datenbank kann er statistische Häufigkeiten ableiten, wie oft beispielsweise das englische Wort «bank» mit Ufer übersetzt wurde und wie häufig mit Bank. Auch ermittelt er aus dem Paralleltext, um wie viel die Chancen für die Übersetzung als Ufer steigen, wenn in der textlichen Nachbarschaft des Wortes «bank» von Gewässern die Rede ist. Zudem registriert der Computer Korrelationen und stellt fest, dass und wie oft dem Wort Ufer ein «das» vorausgeht, aber nur äußerst selten ein «der». Im digitalen Zeitalter ist Paralleltext die wichtigste Schnittstelle zwischen Mensch und Übersetzungsmaschine.
All dies kann vollautomatisch ablaufen. Ist einem Rechner das Prinzip erst einmal für ein Sprachpaar einprogrammiert, lässt es sich mit geringem Zusatzaufwand auf beliebige Sprachpaare anwenden. Auch und insbesondere muss der Programmierer nichts von der Linguistik der beteiligten Sprachen verstehen. Fühlen Sie sich doch einmal ganz unerhört extraterrestrisch und versuchen Sie sich an einer Übersetzung der hypothetischen Sprache Centauri in die hypothetische Sprache Klingonisch. Hier sind 12 Paare von Paralleltext Centauri (a), Klingonisch (b):
1 a. ok-voon ororok sprok.
1 b. at-voon bichat dat.
2 a. ok-drubel ok-voon anok plok sprok.
2 b. at-drubel at-voon pippat rrat dat.
3 a. erok sprok izok hihok ghirok.
3 b. totat dat arrat vat hilat.
4 a. ok-voon anok drok brokjok.
4 b. at-voon krat pippat sat lat.
5 a. wiwok farok izok stok.
5 b. totat jjat quat cat.
6 a. lalok sprok izok jok stok.
6 b. wat dat krat quat cat.
7 a. lalok farok ororok lalok sprok izok enemok.
7 b. wat jjat bichat wat dat eneat.
8 a. lalok brok anok plok nok.
8 b. iat lat pippat rrat nnat.
9 a. wiwok nok izok kantok ok-yurp.
9 b. totat nnat quat oloat at-yurp.
10 a. lalok mok nok yorok ghirok clok.
10 b. wat nnat gat mat bat hilat.
11 a. lalok nok crrrok hihok yorok zanzanok.
11 b. wat nnat arrat mat zanzanat.
12 a. lalok rarok nok izok hihok mok.
12 b. wat nnat forat arrat vat gat.
Und Ihre Aufgabe besteht darin, den Centauri-Satz
farok crrrok hihok yorok clok kantok ok-yurp
ins Klingonische zu übersetzen. Es ist ein Beispiel, das ich Kevin Knight verdanke. Sie werden sehen, dass Übersetzungstätigkeit möglich ist, ohne etwas von diesen beiden erfundenen Sprachen zu verstehen. Auch Flugzeuge schlagen nicht mit den Flügeln, fliegen aber doch.
In öffentlichen Gebäuden findet man Schilder mit Ratschlägen, wie man sich beim Ausbruch eines Feuers verhalten soll. In Deutschland lautet die erste Empfehlung immer: «RUHE BEWAHREN!» In Frankreich heiβt es dagegen «En cas d’incendie: CRIEZ AU FEU!» – Ein interessantes Übersetzungsproblem, wenn man an die mehrsprachigen Schilder in EU-Gebäuden denkt. Man stelle sich vor, wie Deutsche und Franzosen beim Ausbruch eines Feuers rasch die jeweiligen Ratschläge überfliegen und sich dann entsprechend verhalten. Aber was macht das zweisprachige Individuum?
Rainer Kohlmayer, Aphoristiker
Wir wollen den wahrscheinlichkeitstheoretischen Hintergrund der statistischen Übersetzung noch etwas genauer ins Visier nehmen.
Wir befassen uns mit der Übersetzung von einzelnen Sätzen als Grundbausteinen von Texten. Zu jedem Paar von Sätzen (A, Z), wobei A aus der Ausgangssprache und Z aus der Zielsprache ist, sei P(Z/A) die Wahrscheinlichkeit, dass ein guter Übersetzer die Übersetzung Z in der Zielsprache von einem Satz A in der Ausgangssprache vornehmen wird.
Gordischer Übersetzungsknoten
Das schwerste Problem, wenn es um Übersetzungen geht, liefert das Wort ilunga. Zu diesem Ergebnis kam eine Kommission von 1000 international tätigen Linguisten. Ilunga entstammt der Tschiluba-Bantu-Sprache, die im Südwesten der Republik Kongo gesprochen wird. Das Wort bezeichnet «eine Person, die eine empfangene Beschimpfung einmal vergibt, ein zweites Mal toleriert, aber beim dritten Mal reagiert».
BBC World Service, 22.6.2004
In diesem wahrscheinlichkeitstheoretischen Setting kann prinzipiell jeder Satz in der einen Sprache Übersetzung eines jeden Satzes in der anderen Sprache sein. Doch ist diese Wahrscheinlichkeit klein für Paare wie z.B. (Obama est le Président des Etats-Units/Heute ist Donnerstag) und sehr hoch für Paare wie (Aujourd’hui est jeudi/Heute ist Donnerstag). Das Problem der stochastischen maschinellen Übersetzung zwischen Ausgangssprache und Zielsprache ist dann formal das folgende: Zu einem gegebenen Satz A in der
Weitere Kostenlose Bücher