Google翻譯系統 機器翻譯專家感震驚

Google翻譯系統 機器翻譯專家感震驚
CNET 新聞專區:綜合外電  29/03/2007
http://taiwan.cnet.com/news/software/0,2000064574,20116383,00.htm

在Google未來的藍圖當中,利用機器邏輯,而不是語言專家,人們將可瞬間翻譯世界幾大主流語言。

Google採用的方法叫做「統計學機器翻譯」(statistical machinetranslation),它和以往由語言專家編寫文法規則、字典,匯入電腦的模式不同。

新的方法將以前翻譯過的兩種語言文件輸入電腦,由電腦進行比對找出固定模式,當作未來翻譯之用。

Google翻譯專案負責人Franz Och表示,雖然這種技術的翻譯效果不是很完美,但它和以前的機器翻譯相比,已經是一種進步。

Och表示:「一些在機器翻譯領域工作許多年的專家,在看到我們的阿拉伯語/英語翻譯結果後,感到非常震驚,認為是一大突破。」

「另外,一些從沒有接觸過機器翻譯的人,他們在前五句翻譯中只找到一個錯誤。」

但是,對某些翻譯而言,或許百分之百精準並非那麼重要,只要大部分看得懂就行了。

在本周於Google總部的餐廳裡,Och示範了一段由阿拉伯新聞網站翻譯成英文的文章。英文版看起來的確相當流暢。

不過,旁邊兩位俄國工程師卻表示,俄語到英文的翻譯雖然可以勉強被理解,但還是沒有很通順。

Och本人會說德語、英語和一點義大利語,他已經將數百萬聯合國及歐盟的雙語翻譯文件輸入電腦進行對比分析,比如阿拉伯語和英語文件。

有些譯文數量不足,這就會有一些問題,比如一些非洲國家語言。

Och表示:「對照文件越多,翻譯效果越好。」

Google的翻譯程式運用了統計學分析方法,Och希望這種方法可以避免出現外交辭令上的失禮。比如,之前發生過俄羅斯總統普丁的翻譯將德國總理施若德(Gerhard Schroeder)稱為德國「Fuehrer」(德語:元首),因而引起施若德不滿,因為,在德語,這個詞會令人想起希特勒,屬於禁忌辭彙。

Och表示:「我希望我們這套系統的方式是,Fuehrer Gerhard Schroeder 或許只出現幾次,但Bundeskanzler Gerhard Schroeder的出現次數卻超過上百次,則系統會判定後者比較正確。」

目前,Google在阿拉伯文,中文,俄文以及英文的雙向翻譯系統中提供了統計學機器翻譯功能,地址為:www.google.com/language_tools。

愛丁堡大學的教授MilesOsborne去年曾經參與Google翻譯系統開發,他稱讚Googele在這方面的努力,但他表示, 機器翻譯仍然存在局限性。

他說:「Google的系統可以很好的進行語言對譯,比如阿拉伯文與英語。」但他也認為,「機器翻譯無法超越人工翻譯的效果。」

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

請輸入下列驗證碼計算後阿拉伯數字 (Translate it, if not Taiwanese to post reply) *