- 博客(0)
- 资源 (7)
- 收藏
- 关注
实时语音驱动的虚拟说话人.pdf
该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议,音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。这提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,奖识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照Mpeg-4面部动画标准参数的3-d头部模型,实现面部动画的同步生成。主观Mos评测结果表明:本文所实现的实时语音驱动虚拟说话人在同步性和逼真度上的Mos评分分别达到了3.42和3.50。
2012-06-29
语音技术_推开信息无障碍的窗.pdf
科技的发展最重要的目标是使人们的生活更加便捷,语音技术的不断发展同样也是以此为目的的。它的进步不但使一般人的生活更加方便,对于盲人等特殊群体来说,更是一种福音,从某种意义上来说,语音技术的出现给盲人带来了一丝光亮,给他们创造了新生活。
2012-06-29
连续语流中韵律层级和调型组合对重音感知的影响.pdf
由于汉语是声调语言,在连续语流中韵律词重音不仅会受到其所在韵律层级的影响,也会受到调型组合的影响。该文在大规模连续普通话语音数据库的基础上,从韵律层级和调型组合2方面对韵律词重音感知作了细致分析。实验结果表明,在不同的韵律层级和调型组合条件下,重音感知呈现出规律性差异,主要表现为 1) 随着韵律层级的上升,时长和基频都随着重音级别的增大而增大,但基频对重音感知的影响更大;2)在相斥的调型组合下,时长对重音感知的作用要显著高于其在相容调型组合下的作用;3)在连续语流中,双音节韵律词的重音模式没有显著稳定性。
2012-06-29
广东话文本语音转换系统的设计与实现.pdf
汉语的文本语音转换有广泛的应用,用音素或音节为单位的合成方法各有利弊,广东话的语音合成与普通话的合成方法基本类似,但广东话有较多的音节数和罗保铭的单调种类,广东话的多音字和变调字也很多,所以广东话的合成处理技术比较复杂。用广东话语音合成系统作成的盲人用计算机已用于香港地区的盲人界,具有良好的效果
2012-06-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人