首 頁 頭條 聚焦 數據新聞 資訊 數字政協 數字經濟 數字新基建 榜單排行

首頁>數據>數字新基建

首個支持30種方言混說語音大模型亮相

2024年06月17日 09:47  |  作者:崔爽  |  來源:? 科技日報 分享到: 

科技日報訊(記者 崔爽)記者6月16日獲悉,中國電信人工智能研究院發布業內首個支持30種方言自由混說的語音識別大模型——星辰超多方言語音識別大模型。它打破了單一模型只能識別特定單一方言的困境,可同時識別理解粵語、上海話、四川話、溫州話等30多種方言,是國內支持方言種類最多的語音識別大模型。

基于幾億用戶和豐富應用場景優勢,中國電信人工智能研究院構建了超30種、超30萬小時的高質量方言數據庫,推出星辰超多方言語音識別大模型。研發團隊通過超大規模語音預訓練和多方言聯合建模,率先實現單一模型支持30種方言自由混說語音識別,是國內支持方言種類最多、覆蓋人口最多的語音大模型。

團隊首創“蒸餾+膨脹”聯合訓練算法,解決超大規模多場景數據集和大規模參數條件下,預訓練坍縮的問題,實現1B參數80層模型穩定訓練。星辰超多方言語音識別大模型也是業內首個開源的基于離散語音表征的語音識別大模型,將推理時語音傳輸比特率降低數十倍。

據悉,星辰超多方言語音識別大模型已在福建、江西、廣西等地的智能客服試點應用。接入大模型后,智能客服能秒懂30種方言,日均處理約200萬通電話。星辰超多方言語音識別大模型還落地多地市12345平臺,為客服人員賦能,提升溝通效率,助力政務工作智能化升級。

編輯:張芳鳴

久草日韩精品暖暖的在线视频,精品国产综合色在线,极品少妇粉嫩小泬精品视频,青青热久免费精品视频在线播放
亚洲欧洲日韩国产综合 | 久久久久久久久久潮潮 | 激情六月激情网久久 | 日本一区二区三区日本视频 | 一级中文字幕免费看 | 亚洲综合色在线观看一区二区 |