跳至主要內容
翻譯員

微軟翻譯器部落格

微軟研究院機器翻譯組

微軟研究院的機器翻譯 (MSR-MT) 團隊在機器翻譯領域已躋身領導研究機構之列超過 8 年,而 MSR 在自然語言處理方面的一些基礎工作早在 16 年前就已開始。該團隊的機器翻譯方法將語言特徵與最先進的統計機器翻譯演算法整合在一起。該團隊的重點一直是從雙語語料庫中自動獲取翻譯知識,即由原始源語句子及其人類譯者的相應翻譯組成的平行資料。大約 3 年前,該團隊的重點從純粹基於規則的方法轉向包含大量統計處理的混合方法,從而實現了跨領域和新語言的更大可擴展性。

Microsoft 的機器翻譯技術最初是為了內部的本地化目的而開發,以 我們的客戶支援組織可以更頻繁、更廣泛的語言發佈技術支援文件,如果使用人工翻譯,成本將高得令人望而卻步。 有了所有 Microsoft 先前由人工翻譯的文件和本地化軟體,MT 團隊能夠自動訓練其統計 MT 引擎,在技術領域中達到相當好的品質。 此技術已擴展至支援 Windows 本地化團隊、開發人員部門、MSDN 以及微軟內部的其他幾個團隊。它也讓 Microsoft 能夠接觸到更多的客戶,而單靠人工翻譯是不可能做到的。

在專注於微軟本身的翻譯需求之後,該團隊開始建立一個可擴充的網路服務,讓微軟可以向一般大眾提供翻譯服務,作為一個 獨立工具 在網路上,並作為其他產品的一項功能。 由於 Microsoft MT 引擎主要是針對技術資料進行訓練,因此尚未針對其他主題領域的文字翻譯進行調整。 不過,我們希望能持續改善引擎的品質與廣度。我們期待在未來幾個月內,在部落格上與您分享我們的發展。

- 海瑟

Heather Thorne 是 Microsoft Research Machine Translation 小組的商業策略總監。