Selbst Arabisch lernt der PC (fast) ganz alleine

Von: unserem Mitarbeiter Malte Knuth
Letzte Aktualisierung:
Prof. Hermann Ney Übersetzungscomputer
Alles andere als sprachlos: Professor Hermann Ney von den Informatikern der RWTH präsentiert ein Programm, das Reden im EU-Parlament nahezu zeitgleich in eine andere Sprache übersetzt. - Foto: Wolfgang Plitzner

Aachen. Warum beschäftigt sich ein Aachener nahezu täglich mit Arabisch oder Chinesisch? Noch dazu, wenn er gar nicht vorhat, diese schwierigen Sprachen zu lernen und die Länder zu bereisen. Hermann Ney ist bei diesem Thema eine echte Ausnahme. Er hat ständig mit Sprachen zu tun, mit ihrem grammatikalischem Aufbau, den Redewendungen und unzähligen Vokabeln. Allerdings nur in der Theorie. Und da wird die Sache erst richtig kompliziert.

Ney ist Professor an der RWTH Aachen. Er leitet den Lehrstuhl Informatik 6, der sich vor allem auf Spracherkennung und maschinelle Übersetzung spezialisiert hat. Erst kürzlich haben die Wissenschaftler bei einem renommierten und international besetzten Übersetzungswettbewerb den vierten Platz geholt. „Diese Wettbewerbe werden auf den in Wissenschaftskreisen bekannten Webseiten angekündigt, man meldet sich an und bekommt die zu übersetzenden Texte dann per Email zugesandt”, berichtet Ralf Schlüter, einer der Mitarbeiter am Lehrstuhl.

In der Spitzengruppe

Seit 2001 richtet das amerikanische National Institute of Standards and Technology den jährlichen Wettstreit aus. Die Teilnehmer arbeiten vor dem eigenen Rechner, mit eigenen Übersetzungsprogrammen. Schlüter erklärt: „Um mit einem Computerprogramm relativ korrekt Texte aus dem Englischen zu beschreiben, reichen ungefähr 100.000 Wörter”, und er ergänzt: „Nur knapp ein Prozent eines üblichen englischen Textes lassen sich mit einer Gruppe von 100.000 Wörtern nicht darstellen.” Für gelungene Übersetzungen aus dem Deutschen muss der Wortschatz schon deutlich größer sein. „Ganz zu schweigen von Chinesisch oder gar Arabisch. Im Arabischen können das über eine Million Wörter sein”, sagt Schlüter. Umso beachtlicher, dass Ney und Co. zur Spitzengruppe gehören.

Der diesjährige Sieger bei der Übersetzung aus dem Arabischen war eine Gruppe des Suchmaschinenbetreibers Google, dessen Gruppenleiter Franz Och Doktorand an Neys Lehrstuhl war. Auch der bei der Übersetzung aus dem Arabischen zweitplatzierte Hassan Sawaf der US-Firma AppTek arbeitete früher an der RWTH. Das Konzept für die Siegersoftware stammt allerdings aus Aachen. „Das Verfahrensprinzip von Google unterscheidet sich von unserem nur in Kleinigkeiten”, sagt Ney.

Anfangs wurden Grammatik und Wortschatz von Experten zeitraubend eingegeben, die Software von Google oder auch von Neys Team lernt durch den Vergleich vieler Beispieltexte immer mehr dazu und wählt die wahrscheinlichste Übersetzung aus. „Da muss man nicht mehr mühsam Regeln programmieren, sondern baut ein System auf, das automatisch lernt”, so Schlüter. „Und das lässt sich dann relativ einfach auf ein anderes Sprachpaar übertragen.” Für Google sind das lukrative Aussichten. Im Idealfall könnte man mit deutschen Suchbegriffen auch auf vielen anderssprachigen Seiten suchen, weil diese Seiten von einer Software automatisch und vor allem korrekt übersetzt werden. Doch auch in anderen Bereichen gewinnen Übersetzungsprogramme zunehmend an Bedeutung. Gefragt sind nicht nur maschinelle Übersetzungen, sondern auch effektive Spracherkennungsprogramme, die gesprochene Sprachen erkennen, bevor sie übersetzt werden.

Viel Luft nach oben

Gemeinsam mit Partnern im Rahmen des europäischen Projekts TC-Star werden diese Verfahren am Lehrstuhl Neys sogar zu einem automatischen Simultandolmetscher zusammengeführt: Die gesprochene Sprache wird über den Weg der Spracherkennung in Schriftsprache umgesetzt, übersetzt und kommt dann von einer anderen Stimme aus dem PC-Lautsprecher. Für die Forscher ist beim Thema Sprachübersetzung dennoch viel Luft nach oben. Viele große Unternehmen haben Interesse an automatischer Sprachverarbeitung und forschen auch selbst daran. An der RWTH beschäftigt man sich seit Mitte der 90er Jahre damit.

Die Teilnahme am Wettbewerb hat für die RWTH-Informatiker gleich mehrere Gründe. Vom Leistungsvergleich der Übersetzungssysteme ist da die Rede, aber auch von der Möglichkeit, von der Konkurrenz zu lernen: Ein Teil der Wettbewerbsteilnehmer trifft sich in Workshops zum Wissensaustausch in den USA. Aber auch kommerzielle Hintergründe spielen durchaus eine Rolle, „schließlich können gute Wettbewerbsplatzierungen einen Vorteil bei der Vergabe von Projekten bringen”, bestätigt Ney und ist Augenblicke später wieder hinter seinem Bildschirm verschwunden.
Leserkommentare

Leserkommentare (0)

Sie schreiben unter dem Namen:



Diskutieren Sie mit!

Damit Sie Artikel kommentieren können, müssen Sie sich einmalig registrieren — bereits registrierte Leser müssen zum Schreiben eines Kommentars eingeloggt sein. Beachten Sie unsere Diskussionsregeln, die Netiquette.

Homepage aktualisiert

Finden Sie jetzt neue aktuelle Informationen auf unserer Startseite

Wieder zur Homepage

Die Homepage wurde aktualisiert