跳至主要內容
翻譯員

微軟翻譯器部落格

Microsoft Custom Translator 將翻譯品質標準推近人類同等水平

Custom Translator 繼續走在機器翻譯技術的最前端。

2020 年 8 月初,我們開始將自訂 Translator 從基於 Long Short-Term Memory (aka LSTM) 的神經機器翻譯架構 (或 V1) 升級至 Microsoft Translator 最先進的 Transformer 架構 (或 V2)。V2 是相同的翻譯架構,為標準非客製化 Translator API 以及 Microsoft Office 365、Speech、Bing.com/translator、Edge 等的翻譯提供動力。

八月的版本讓客戶可以使用 字典 (短語或句子)文件類型,在 V2 平台之上建立自訂模型,以快速改善 V1 平台的翻譯品質。

今天,Custom Translator 完成了完整的 V2 平台升級,提供比之前更大的翻譯品質增益。客戶現在可以使用所有文件類型(訓練、測試、調整、詞彙辭典和句子辭典),使用完整的文字文件建立自訂模型,例如 Office 文件、PDF、HTML 和純文字。

透過此版本,企業、中小型企業、應用程式開發人員和語言服務供應商可以建立先進的客製化神經翻譯系統,尊重其定義的商業術語,並將這些系統無縫整合至現有或新的應用程式、工作流程和網站中,以吸引客戶並促進業務成長。

我們對每個新的基線語言模型都進行了嚴格的人工評估,以確保在所有領域的通用輸入上,翻譯質量都能持續達到高標準。然而,透過客製化訓練的專門翻譯系統,客戶可以在先前已翻譯的特定領域文件上訓練客製化翻譯系統,以達到更高的特定領域術語及風格的一致性。這些先前已翻譯過的文件可讓 Custom Translator 學習上下文中的優先翻譯,因此 Translator 可以在上下文需要時應用這些詞彙和詞組,並產生目標語言的流暢翻譯,同時尊重目標語言依據上下文的文法。

升級的好處

我們使用 BLEU 得分 (研究界的標準方式)來衡量新訓練基線模型的翻譯品質。一到兩個 BLEU 點的增益是值得肯定的成就。與之前的 V1 平台相比,Custom Translator V2 平台升級將帶來顯著的改進。下面的柱狀圖表描述了某些領域的翻譯品質 BLEU 分數提升,以及訓練資料集大小的影響。

使用標準 Translator、Custom Translator V1 和 Custom Translator V2 時,樣本域翻譯品質的 BLEU 分數。
以千為單位的訓練資料集('auto-28k' 表示汽車領域的 28,000 個平行句子)。

值得注意的是,實際的品質改善取決於客戶資料品質、訓練資料集大小和領域涵蓋範圍。

「我們希望透過神經網路進行翻譯,不僅能提升品質和速度,還能提供大數據評估方面的進展」。 Volkswagen AG 語言部品質與供應商管理主管 Nikolas Meyer-Aun 表示。

Custom Translator 將提供免費升級至 V2。您可以免費將工作區中每個專案的一個模型重新訓練至 V2 平台。當您檢視專案時,您應該會看到該專案是否仍有免費升級點數的訊息。此優惠從今天開始,到 2021 年 1 月 31 日結束。2021 年 1 月 31 日之後,每次重新訓練將收取正常訓練費用。

您可以在下面的常見問題中瞭解升級到版本 2 的更多資訊。

常見問題

  1. 您要在 V2 中發佈什麼?
    我們將推出 Custom Translator 平台升級版 (V2),利用微軟最先進的神經機器翻譯架構,大幅提升翻譯品質。使用者體驗與 V1 相同。沒有新的東西需要學習,只有更好的翻譯。如需快速複習,請觀賞以下內容 YouTube 上的快速入門影片.
  2. 將目前部署的機型升級至 V2 平台有什麼好處?
    翻譯品質大幅提升;Custom Translator V2 平台升級後,將比標準 Translator 和之前的 V1 平台有顯著的提升。上面的柱狀圖顯示了一些常見領域的翻譯品質 BLEU 分數,以及訓練資料集大小的影響。
  3. 如何使用免費升級至 V2 積分?
    當您檢視專案詳細資料時,免費信用額訊息會顯示(請參閱以下圖片),並會持續顯示,直到您成功重新訓練模型或優惠於 2021 年 1 月 31 日結束為止。

  4. 如何將我已部署(或未部署)的自訂模型升級到 V2 平台?
    如果您有已部署或未部署的純字典模型,且該模型是在 2020 年 8 月 3 日之後重新訓練的,則該模型已升級至 V2 平台。否則,您應該啟動新的模型訓練。一旦新模型訓練成功,「Swap」按鈕將會顯示。按一下「Swap」以部署新模型。注意:"Swap "按鈕啟用無停機部署。也就是說,所有翻譯要求將繼續由先前的模型提供服務,直到新模型部署完成並開始運作,然後新模型將提供新的翻譯要求,而先前的模型將不再部署。
  5. V2 平台升級後,我可以繼續重新部署 V1 自訂模型嗎?
    是的。我們瞭解客戶可能有理由希望繼續使用在 V1 平台上訓練的模型。V1 模型可以在 V2 平台上執行。未來,V1 模型將不可重新部署。注意:一旦您重新訓練 V1 模型,新模型將在 V2 平台上。模型 "索引標籤將顯示所有新 (V2) 和舊 (V1) 模型。
  6. 我是自訂翻譯的新手,如何開始使用 Custom Translator?
    若要建立自訂模型,請觀賞上面的快速入門影片,並參閱 docs.microsoft.com 上的說明文件: https://docs.microsoft.com/azure/cognitive-services/translator/custom-translator/overview

使用 Microsoft 自訂翻譯器可以做什麼

使用您特定領域的術語建立自訂模型,並使用 Microsoft Translator API 進行即時翻譯。

使用 Microsoft Custom Translator 與您的翻譯解決方案,協助您的業務全球化並改善客戶互動。

如需 Microsoft 翻譯器解決方案的詳細資訊,請造訪: https://www.rarnonalumber.com/translator/business.