統一語音服務現提供可自訂的語音轉錄、翻譯及合成功能
使用統一的 Speech 服務將語音整合到您的應用程式、工作流程和網站中。 微軟建置.Speech 將現有的 Translator Speech API、Bing Speech API 和 Custom Speech Service (預覽) 的功能整合為統一且可完全客製化的服務。
現在您可以在同一訂閱中使用語音轉換為文字、語音翻譯和文字轉換為語音服務。這三種服務都可以使用預覽的 全新自訂語音、翻譯和語音功能,本週也在 //build 上公佈:
- Speech to Text (語音轉錄) - 使用預設或自訂模型將口語音訊轉換為文字,這些模型是針對使用者的特定詞彙或說話風格量身打造 (語言模型自訂),或更符合預期環境,例如背景噪音 (聲學模型自訂)。語音轉換為文字技術可支援廣泛的使用個案,例如語音指令、即時轉錄和呼叫中心日誌分析。
- 文字轉語音 (語音合成) - 將文字近乎即時地轉換為音訊,可選擇超過 75 種預設語音,或使用全新的自訂語音模型,根據您自己的錄音創造獨特且可辨識的品牌語音,為任何應用程式帶來語音效果。
- 語音翻譯 - 利用以神經機器翻譯 (NMT) 技術為基礎的模型,提供即時語音翻譯功能。現在可以自訂語音翻譯管道的三個元素:語音辨識、文字轉語音和機器翻譯。
神經翻譯與 最新版本的 Translator 文字 API (第 3 版), 也可以使用使用新的 Translator Custom 功能建立的自訂系統。
統一的 Speech 服務目前以預覽版提供。對於需要一般可用性服務的語音翻譯,開發人員應繼續使用 Microsoft Translator Speech API。請遵循 Microsoft Translator 部落格 和 推特 頁面,以取得持續更新的 Microsoft Translator 服務公告。
進一步瞭解 認知服務部落格.