7月29日,記者從中國科學技術大學獲悉,在剛剛結束的國際語音合成大賽上,該校語音及語言信息處理國家工程實驗室報送的參賽系統,在25項測試指標中11項居世界第一,取得了所有參賽系統中最好的綜合表現,進一步穩固了中科大語音合成技術在世界上的領先地位。
作為國際上規模最大、最具影響力的語音合成比賽,國際語音合成大賽每年吸引了美國卡耐基-梅隆大學等眾多語音技術領域的世界知名機構參賽。與往屆相比,本屆大賽首次將主要測試語種由英語轉換到非英語語種,要求提交的合成系統包括印地語、阿薩姆語等6種印度語種,并增加這些語種與英文混讀情況下的合成測試,進一步提高了測試的難度。
在比賽中,中科大研究團隊充分發揮在語音合成核心技術上的優勢,采用基于統計聲學模型的單元挑選與參數合成技術方案,提出并實現基于深度神經網絡的合成新方法,進一步提高了合成語音質量。最終,中科大提交的參賽系統獲得印地語合成語音相似度與可懂度、印地語英語混讀合成語音相似度與自然度等11個指標的第一名。
中科大語音及語言信息處理國家工程實驗室,由國家發改委于2011年6月批準成立,中科大與科大訊飛公司聯合共建,是我國語音產業界唯一的國家級研究開發平臺。