微軟翻譯器部落格

統一語音服務現提供可自訂的語音轉錄、翻譯及合成功能

發佈於 2018 年 5 月 7 日2019 年 3 月 15 日由微軟翻譯器

使用統一的 Speech 服務將語音整合到您的應用程式、工作流程和網站中。微軟建置.Speech 將現有的 Translator Speech API、Bing Speech API 和 Custom Speech Service (預覽) 的功能整合為統一且可完全客製化的服務。

現在您可以在同一訂閱中使用語音轉換為文字、語音翻譯和文字轉換為語音服務。這三種服務都可以使用預覽的全新自訂語音、翻譯和語音功能，本週也在 //build 上公佈：

Speech to Text (語音轉錄) - 使用預設或自訂模型將口語音訊轉換為文字，這些模型是針對使用者的特定詞彙或說話風格量身打造 (語言模型自訂)，或更符合預期環境，例如背景噪音 (聲學模型自訂)。語音轉換為文字技術可支援廣泛的使用個案，例如語音指令、即時轉錄和呼叫中心日誌分析。
文字轉語音 (語音合成) - 將文字近乎即時地轉換為音訊，可選擇超過 75 種預設語音，或使用全新的自訂語音模型，根據您自己的錄音創造獨特且可辨識的品牌語音，為任何應用程式帶來語音效果。
語音翻譯 - 利用以神經機器翻譯 (NMT) 技術為基礎的模型，提供即時語音翻譯功能。現在可以自訂語音翻譯管道的三個元素：語音辨識、文字轉語音和機器翻譯。

神經翻譯與最新版本的 Translator 文字 API (第 3 版), 也可以使用使用新的 Translator Custom 功能建立的自訂系統。

統一的 Speech 服務目前以預覽版提供。對於需要一般可用性服務的語音翻譯，開發人員應繼續使用 Microsoft Translator Speech API。請遵循 Microsoft Translator 部落格和推特頁面，以取得持續更新的 Microsoft Translator 服務公告。

進一步瞭解認知服務部落格.

瞭解更多

Microsoft Translator 語音翻譯