跳至主要內容
翻譯員

微軟翻譯器部落格

測試翻譯品質:客座部落格

Anand Chakravarty 是機器翻譯團隊的 SDET,在過去的 2.5 年中,他在微軟工作了 8 年,是 MT 團隊中的第一位產品測試員(而且 「仍然享受著測試 MT 的樂趣 :-)」)。 今天的客座部落格是關於測試翻譯品質。 

-------------------------------------

當談到驗證翻譯系統的品質時,首先會想到的一點是,如何衡量翻譯的品質,或準確地說,如何衡量翻譯的精確度?使用電腦在人類語言之間進行翻譯是一個已有近半世紀歷史的領域。這個領域極具挑戰性,即使是目前最好的機器翻譯系統,也無法達到完全令人滿意的語言品質。

挑戰之一是人類為了理解口語/書面文字的意義,需要處理許多不同的資料點。語法、解析、語義、上下文、消歧、重新排序,所有這些,還有更多,都是為了理解一個句子。而這只是單一語言的句子。現在請考慮應用所有這些方法來重建另一種語言的句子,並使其同樣有意義。

一些例子或許有助於更清楚地說明這一點。2008 年奧運會」一詞相當明確。同樣地,「Elections 2008」一詞可能是指美國的總統選舉。但是,如果使用者來自加拿大等地,則更可能是指當地的地方選舉。

一個更一般,因此也更常見的例子是「The note was wrong」這樣的句子。note "這個詞是指信息還是音樂術語?正確的翻譯取決於上下文。使用更多的上下文,您就有機會獲得更準確的翻譯。然而,這也是有代價的:系統嘗試取得的上下文越多,其效能就越慢。精明的出貨決策包括在提高翻譯精確度與提供使用者可行的翻譯結果之間取得適當的平衡。當然,兩者都很重要。關鍵在於了解您要根據最終結果對使用者的實用性,將改善的努力導向何處。

這在翻譯文件或網頁(而非單獨句子)時尤其有趣。比方說,我們收到一個包含 100 個句子的網頁翻譯請求。依據翻譯系統架構的不同,這些句子可以全部交由一個流程處理,也可以分佈在多個流程/機器上。無論如何,翻譯整個網頁所花的時間顯然與翻譯一個句子所花的最長時間成正比。我們要花多少時間翻譯一個句子,才能讓投入的時間對使用者的時間造成損害?為了追求最佳的翻譯效果,我們最終可能會讓使用者無法獲得任何資訊來回應他們的翻譯請求。因此,系統的效用受制於平衡語言品質與應用程式效能的決策。

Microsoft Translator 產品具有雙語檢視器的附加功能,這在公開的翻譯產品中是獨一無二的。它支援平行文字高亮、同步捲動,並以漸進式渲染方式顯示頁面。這讓我們的使用者所看到的內容又多了一層,因此也多了一層的潤飾與完成。

在未來幾週內,我們希望為您帶來更多特定領域的詳細資訊,這些領域過去和現在都在進行測試,以提供最優質的翻譯系統。如果您對此事有任何疑問,或是您一直想問的問題 :-),歡迎在評論區留言。