AI超擬真有聲書還原度有多高 新技術(shù)AI語音合成是什么?
時(shí)間:2022-04-21 23:28 來源:今日頭條 責(zé)任編輯:毛青青
原標(biāo)題:AI超擬真有聲書還原度有多高 新技術(shù)AI語音合成是什么?
前兩天師兄跟我聊到人工合成語音的一個(gè)案例,估計(jì)大多數(shù)人還蒙在鼓里!現(xiàn)在隨處可見的明星導(dǎo)航語音包,難不成都是明星一條條在錄音棚里面錄的吧?有些明星檔期都安排不過來,哪有時(shí)間去給我們錄成百上千條語音。
我仔細(xì)查證后,發(fā)現(xiàn)果然如此,很多所謂的明星語音都是通過AI技術(shù)人工合成的,而且辨識(shí)度極高,不禁讓人感慨——科技時(shí)代果然是“懶人”的時(shí)代啊。
其實(shí)現(xiàn)在的語音工具不僅是明星語音,最近我了解到AI擬真有聲書《智能交通》在4月21日喜馬拉雅APP正式上線了。這本書的內(nèi)容是來自百度ceo李彥宏的《智能交通:影響人類未來10—40年的重大變革》,主要闡述了未來利用人工智能技術(shù)可以極大的提高道路通行效率,解決城市擁堵等問題,全書約20萬字。
我之所以關(guān)注到這個(gè)消息,就是因?yàn)樗彩且粋(gè)“懶人時(shí)代”的智能利器,所謂的AI擬有聲書,就是通過大數(shù)據(jù)分析一個(gè)人的聲音,語調(diào)音色等等,然后利用AI技術(shù)完成語音合成的智能有聲書。為了驗(yàn)證這個(gè)所謂“”的識(shí)別度,我還特意去找了幾段李彥宏本人的公開講話音頻來做對(duì)比,基本做得高真還原本人聲音! #李彥宏AI有聲書還原度超九成#
據(jù)說,百度這一套語音合成技術(shù)目前只需要使用者提供少量音頻語句,就能實(shí)現(xiàn)對(duì)用戶聲音的簡(jiǎn)單復(fù)制,再多錄制點(diǎn)素材就能合成媲美原聲的音頻內(nèi)容,屬實(shí)讓人嘆為觀止。
其實(shí)現(xiàn)在很多人感覺人工合成語音沒有什么新鮮的,畢竟網(wǎng)絡(luò)上機(jī)器語音朗讀已經(jīng)不是什么稀罕事,但是和過去冰冷的機(jī)器閱讀發(fā)音不同的是,百度語音合成技術(shù)在文本情感和閱讀習(xí)慣的斷句上有了深入的研究,不僅對(duì)聲韻母韻律表征進(jìn)行建模,對(duì)發(fā)音風(fēng)格與音色也進(jìn)行了融合,再通過大數(shù)據(jù)深入模擬不同語境下的聲學(xué)變化,這才達(dá)到自然度、流暢度水平與原聲幾乎無法區(qū)分的效果。想要攻克這些難關(guān)并不容易,很顯然這些年來百度語音合成團(tuán)隊(duì)是下了狠功夫的。
一本20萬字的專著,如果是李彥宏本人親自朗讀,不知道要花費(fèi)多少時(shí)間和精力。但是隨著人工合成語音技術(shù)的發(fā)展,我們大可以將大量的文本內(nèi)容迅速轉(zhuǎn)化為想要的,有溫度的聲音,這對(duì)于創(chuàng)作者而言,可以在保障文本質(zhì)量的同時(shí)極大提升效率。無異于是一場(chǎng)“創(chuàng)作內(nèi)容改革”。
投稿郵箱:chuanbeiol@163.com 詳情請(qǐng)?jiān)L問川北在線:http://fishbao.com.cn/
川北在線-川北全搜索版權(quán)與免責(zé)聲明
①凡注明"來源:XXX(非在線)"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。
②本站所載之信息僅為網(wǎng)民提供參考之用,不構(gòu)成任何投資建議,文章觀點(diǎn)不代表本站立場(chǎng),其真實(shí)性由作者或稿源方負(fù)責(zé),本站信息接受廣大網(wǎng)民的監(jiān)督、投訴、批評(píng)。
③本站轉(zhuǎn)載純粹出于為網(wǎng)民傳遞更多信息之目的,本站不原創(chuàng)、不存儲(chǔ)視頻,所有視頻均分享自其他視頻分享網(wǎng)站,如涉及到您的版權(quán)問題,請(qǐng)與本網(wǎng)聯(lián)系,我站將及時(shí)進(jìn)行刪除處理。