AI超拟真有声书还原度有多高 新技术AI语音合成是什么?
时间:2022-04-21 23:28:02 来源:今日头条
原标题:AI超拟真有声书还原度有多高 新技术AI语音合成是什么?
前两天师兄跟我聊到人工合成语音的一个案例,估计大多数人还蒙在鼓里!现在随处可见的明星导航语音包,难不成都是明星一条条在录音棚里面录的吧?有些明星档期都安排不过来,哪有时间去给我们录成百上千条语音啊?
我仔细查证后,发现果然如此,很多所谓的明星语音都是通过AI技术人工合成的,而且辨识度极高,不禁让人感慨——科技时代果然是“懒人”的时代啊。
其实现在的语音工具不仅是明星语音,最近我了解到AI拟真有声书《智能交通》在4月21日喜马拉雅APP正式上线了。这本书的内容是来自百度ceo李彦宏的《智能交通:影响人类未来10—40年的重大变革》,主要阐述了未来利用人工智能技术可以极大的提高道路通行效率,解决城市拥堵等问题,全书约20万字。
我之所以关注到这个消息,就是因为它也是一个“懒人时代”的智能利器,所谓的AI拟有声书,就是通过大数据分析一个人的声音,语调音色等等,然后利用AI技术完成语音合成的智能有声书。为了验证这个所谓“”的识别度,我还特意去找了几段李彦宏本人的公开讲话音频来做对比,基本做得高真还原本人声音! #李彦宏AI有声书还原度超九成#
据说,百度这一套语音合成技术目前只需要使用者提供少量音频语句,就能实现对用户声音的简单复制,再多录制点素材就能合成媲美原声的音频内容,属实让人叹为观止。
其实现在很多人感觉人工合成语音没有什么新鲜的,毕竟网络上机器语音朗读已经不是什么稀罕事,但是和过去冰冷的机器阅读发音不同的是,百度语音合成技术在文本情感和阅读习惯的断句上有了深入的研究,不仅对声韵母韵律表征进行建模,对发音风格与音色也进行了融合,再通过大数据深入模拟不同语境下的声学变化,这才达到自然度、流畅度水平与原声几乎无法区分的效果。想要攻克这些难关并不容易,很显然这些年来百度语音合成团队是下了狠功夫的。
一本20万字的专著,如果是李彦宏本人亲自朗读,不知道要花费多少时间和精力。但是随着人工合成语音技术的发展,我们大可以将大量的文本内容迅速转化为想要的,有温度的声音,这对于创作者而言,可以在保障文本质量的同时极大提升效率。无异于是一场“创作内容改革”。
投稿:chuanbeiol@163.com
点击展开全文