資(zī)訊觀點
NEWS AND PERSPECTIVES

标貝科技歌聲合成數據庫上線

作者: 深圳首創深輝投資有限公司 時間: 2019-01-23

标貝科技2019年的第一個(gè)大動(dòng)作,是獻上籌備良久、精心打造的歌聲數據庫:多位專業(yè)歌手的中(zhōng)文(wén)歌聲數據,包含多種音色和(hé)歌曲風格。

 

随着虛拟偶像文(wén)化的不斷發展,語音合成、歌聲合成技術(shù),扮演着越來越重要的角色。

 

利用AI技術(shù)所打造的聲音,也越來越受到青睐。标貝科技,利用自身的技術(shù)優勢,正在努力幫助合作夥伴完成打造虛拟歌手的第一步。

 

歌聲合成與語音合成相比,既有相似性,也有其特殊性。

 

一方面,歌聲是依賴于歌譜的,歌聲中(zhōng)的每個(gè)音節的音長或聲調可(kě)以根據歌譜來做比較準确的預測。

 

另一方面,歌聲的音域較寬,而且每個(gè)歌手都有适合自己的音域範圍,如(rú)果超出範圍的歌曲,合成效果可(kě)能會受到一定的影響。

 

合成歌聲的質量在很大程度上取決于數據庫的質量。

 

與語音相比,歌聲的音高、音強、音長等變化組合繁複,需要從處理流程、處理方法和(hé)标注人員素質上“三管齊下(xià)”,才能出好聲音。

 

作為定制化的數據服務提供商(shāng),标貝科技利用在語音數據處理領域的獨到經驗,針對複雜度更高的歌聲合成,也設計了一套專業(yè)化的數據處理流程。

 

專業(yè)歌手

 

在音源選擇上,經過訓練的專業(yè)歌手可(kě)以保持在共振峰、爆發性和(hé)音域有更穩定的表現,對歌唱(chàng)技巧把握更成熟。

 

專業(yè)錄制

 

在專業(yè)錄音棚環境下(xià)完成整個(gè)數據的采集,并且全程進行監督和(hé)指導,确保數據質量。

 

規模大

 

通(tōng)過語料設計技術(shù),優選數百首歌曲,降低模型訓練的難度,改善預測效果。

 

精細化标注

 

在對聲音數據的處理上,歌聲比語音所包含的專業(yè)因素更多,需要标注人員對音樂(yuè)有較深的理解,才能根據錄制的人聲演唱(chàng)中(zhōng)所包含的音高、節拍、演唱(chàng)技巧、歌詞等内容進行精細标注。

 

在對音頻标注的标注格式,采用兼容性強、記錄音樂(yuè)信息精确性高的 MusicXML 格式,對時值、升降号、節拍、譜号等樂(yuè)譜屬性進行記錄。

 

為了減少(shǎo)标注的錯誤率,标貝在重音、頓音、假聲、連音等音符的相關(guān)信息的區分和(hé)記錄上做了大量工作。

 

甚至在對較難把握的顫音的處理上,也有專門的識别和(hé)标注記号。

 

歌曲合成的流程繁複,貫穿每個(gè)環節的質量控制是保質保量的生命線:更優質的數據,才有更優美的歌聲。

 

(内容轉載自“标貝科技”微信公衆号,2019年1月(yuè)18日)

聯系我們
tel: 0755-88993888
投資(zī)申請
誠聘英才
返回頂部