TTS技术



TTSText To Speech的缩写,即从文本到语音,是人机对话的一部分,让机器能够说话。
它是同时运用语言学心理学的杰出之作,在内置芯片的支持之下,通过神经网络的设计,把文字智能地转化为自然语音流。
TTS技术对文本文件进行实时转换,转换时间之短可以秒计算。
在其特有智能语音控制器作用下,文本输出的语音音律流畅,
使得听者在听取信息时感觉自然,毫无机器语音输出的冷漠与生涩感。
TTS语音合成技术即将覆盖国标一、二级汉字,具有英文接口自动识别中、英文,支持中英文混读
所有声音采用真人普通话为标准发音,
实现了120-150个汉字/分钟的快速语音合成,
朗读速度达3-4个汉字/秒
使用户可以听到清晰悦耳的音质和连贯流畅的语调。
现在有少部分MP3随身听具有了TTS功能

TTS语音合成应用的一种,
它将储存于电脑中的文件,
如帮助文件或者网页,
转换成自然语音输出。

TTS不仅能帮助有视觉障碍的人阅读计算机上的信息,
更能增加文本文档的可读性。
现在的TTS应用包括语音驱动的邮件以及声音敏感系统
并常与声音识别程序一起使用。
现在有很多TTS的产品,

包括
1. 语音合成助手
2. PDF Markup Cloud
3. PDF 大师
4. Read Please 2000
5. Proverbe Speech Unit
6. Next Up TechnologyTextAloud
7. 朗讯
8. Elan
9. AT&T都有自己的语音合成产品。

1 TTS解析

TTS文语转换用途很广,
包括电子邮件的阅读IVR系统的语音提示等等,
目前IVR系统已广泛应用于各个行业(如电信、交通运输等)。
TTS所用的关键技术就是语音合成(SpeechSynthesis)

早期的TTS一般采用专用的芯片实现,
德州仪器公司TMS50C10/TMS50C57
飞利浦PH84H36等,但主要用在家用电器儿童玩具中。

基于微机应用的TTS一般用纯软件实现
主要包括以下几部分:

  • 文本分析-对输入文本进行语言学分析,逐句进行词汇的语法的语义的分析,以确定句子的低层结构和每个字的音素的组成,包括文本的断句字词切分多音字的处理数字的处理缩略语的处理等。

  • 语音合成-把处理好的文本所对应的单字短语语音合成库中提取,把语言学描述转化成言语波形

  • 韵律处理-合成音质(Qualityof Synthetic Speech)是指语音合成系统所输出的语音的质量,一般从清晰度(或可懂度)自然度连贯性等方面进行主观评价。
    清晰度是正确听辨有意义词语的百分率;
    自然度用来评价合成语音音质是否接近人说话的声音,合成词语的语调是否自然;
    连贯性用来评价合成语句是否流畅。

要合成出高质量的语音,所采用的算法是极为复杂的,
因此对机器的要求也非常高。
算法的复杂度决定了目前微机并发进行多通道TTS系统容量

  • 1
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值