你好,歡迎來到川北在線
微信
騰訊微博
新浪微博
AI超擬真有聲書還原度有多高 新技術(shù)AI語音合成是什么?
時間:2022-04-21 23:28   來源:今日頭條   責(zé)任編輯:毛青青
  原標題:AI超擬真有聲書還原度有多高 新技術(shù)AI語音合成是什么?
 
  前兩天師兄跟我聊到人工合成語音的一個案例,估計大多數(shù)人還蒙在鼓里!現(xiàn)在隨處可見的明星導(dǎo)航語音包,難不成都是明星一條條在錄音棚里面錄的吧?有些明星檔期都安排不過來,哪有時間去給我們錄成百上千條語音。
 
  我仔細查證后,發(fā)現(xiàn)果然如此,很多所謂的明星語音都是通過AI技術(shù)人工合成的,而且辨識度極高,不禁讓人感慨——科技時代果然是“懶人”的時代啊。

 
  其實現(xiàn)在的語音工具不僅是明星語音,最近我了解到AI擬真有聲書《智能交通》在4月21日喜馬拉雅APP正式上線了。這本書的內(nèi)容是來自百度ceo李彥宏的《智能交通:影響人類未來10—40年的重大變革》,主要闡述了未來利用人工智能技術(shù)可以極大的提高道路通行效率,解決城市擁堵等問題,全書約20萬字。
 
  我之所以關(guān)注到這個消息,就是因為它也是一個“懶人時代”的智能利器,所謂的AI擬有聲書,就是通過大數(shù)據(jù)分析一個人的聲音,語調(diào)音色等等,然后利用AI技術(shù)完成語音合成的智能有聲書。為了驗證這個所謂“”的識別度,我還特意去找了幾段李彥宏本人的公開講話音頻來做對比,基本做得高真還原本人聲音! #李彥宏AI有聲書還原度超九成#
 
  據(jù)說,百度這一套語音合成技術(shù)目前只需要使用者提供少量音頻語句,就能實現(xiàn)對用戶聲音的簡單復(fù)制,再多錄制點素材就能合成媲美原聲的音頻內(nèi)容,屬實讓人嘆為觀止。
 
  其實現(xiàn)在很多人感覺人工合成語音沒有什么新鮮的,畢竟網(wǎng)絡(luò)上機器語音朗讀已經(jīng)不是什么稀罕事,但是和過去冰冷的機器閱讀發(fā)音不同的是,百度語音合成技術(shù)在文本情感和閱讀習(xí)慣的斷句上有了深入的研究,不僅對聲韻母韻律表征進行建模,對發(fā)音風(fēng)格與音色也進行了融合,再通過大數(shù)據(jù)深入模擬不同語境下的聲學(xué)變化,這才達到自然度、流暢度水平與原聲幾乎無法區(qū)分的效果。想要攻克這些難關(guān)并不容易,很顯然這些年來百度語音合成團隊是下了狠功夫的。
 
  一本20萬字的專著,如果是李彥宏本人親自朗讀,不知道要花費多少時間和精力。但是隨著人工合成語音技術(shù)的發(fā)展,我們大可以將大量的文本內(nèi)容迅速轉(zhuǎn)化為想要的,有溫度的聲音,這對于創(chuàng)作者而言,可以在保障文本質(zhì)量的同時極大提升效率。無異于是一場“創(chuàng)作內(nèi)容改革”。


   投稿郵箱:chuanbeiol@163.com   詳情請訪問川北在線:http://fishbao.com.cn/

川北在線-川北全搜索版權(quán)與免責(zé)聲明
①凡注明"來源:XXX(非在線)"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé),本網(wǎng)不承擔此類稿件侵權(quán)行為的連帶責(zé)任。
②本站所載之信息僅為網(wǎng)民提供參考之用,不構(gòu)成任何投資建議,文章觀點不代表本站立場,其真實性由作者或稿源方負責(zé),本站信息接受廣大網(wǎng)民的監(jiān)督、投訴、批評。
③本站轉(zhuǎn)載純粹出于為網(wǎng)民傳遞更多信息之目的,本站不原創(chuàng)、不存儲視頻,所有視頻均分享自其他視頻分享網(wǎng)站,如涉及到您的版權(quán)問題,請與本網(wǎng)聯(lián)系,我站將及時進行刪除處理。



圖庫
合作媒體
金寵物 綠植迷
法律顧問:ITLAW-莊毅雄律師