TTS是Text To Speech的缩写,即从文本到语音,是人机对话的一部分,让机器能够说话。
它是同时运用语言学和心理学的杰出之作,在内置芯片的支持之下,通过神经网络的设计,把文字智能地转化为自然语音流。
TTS技术对文本文件进行实时转换,转换时间之短可以秒计算。
在其特有智能语音控制器作用下,文本输出的语音音律流畅,
使得听者在听取信息时感觉自然,毫无机器语音输出的冷漠与生涩感。
TTS语音合成技术即将覆盖国标一、二级汉字,具有英文接口,自动识别中、英文,支持中英文混读。
所有声音采用真人普通话为标准发音,
实现了120-150个汉字/分钟的快速语音合成,
朗读速度达3-4个汉字/秒,
使用户可以听到清晰悦耳的音质和连贯流畅的语调。
现在有少部分MP3随身听具有了TTS功能。
TTS是语音合成应用的一种,
它将储存于电脑中的文件,
如帮助文件或者网页,
转换成自然语音输出。
TTS不仅能帮助有视觉障碍的人阅读计算机上的信息,
更能增加文本文档的可读性。
现在的TTS应用包括语音驱动的邮件以及声音敏感系统,
并常与声音识别程序一起使用。
现在有很多TTS的产品,
包括
1. 语音合成助手
2. PDF Markup Cloud
3. PDF 大师
4. Read Please 2000
5. Proverbe Speech Unit
6. Next Up Technology的TextAloud
7. 朗讯
8. Elan
9. AT&T都有自己的语音合成产品。
1 TTS解析
TTS文语转换用途很广,
包括电子邮件的阅读、IVR系统的语音提示等等,
目前IVR系统已广泛应用于各个行业(如电信、交通运输等)。
TTS所用的关键技术就是语音合成(SpeechSynthesis)。
早期的TTS一般采用专用的芯片实现,
如德州仪器公司的TMS50C10/TMS50C57
飞利浦的PH84H36等,但主要用在家用电器或儿童玩具中。
基于微机应用的TTS一般用纯软件实现,
主要包括以下几部分:
文本分析-对输入文本进行语言学分析,逐句进行词汇的、语法的和语义的分析,以确定句子的低层结构和每个字的音素的组成,包括文本的断句、字词切分、多音字的处理、数字的处理、缩略语的处理等。语音合成-把处理好的文本所对应的单字或短语从语音合成库中提取,把语言学描述转化成言语波形。韵律处理-合成音质(Qualityof Synthetic Speech)是指语音合成系统所输出的语音的质量,一般从清晰度(或可懂度)、自然度和连贯性等方面进行主观评价。
清晰度是正确听辨有意义词语的百分率;
自然度用来评价合成语音音质是否接近人说话的声音,合成词语的语调是否自然;
连贯

TTS(Text To Speech)技术让机器能够将文本转化为自然语音。内容涵盖TTS的基本构架、中文TTS系统、TTS在CTI中的应用以及相关产品。TTS在多个领域广泛应用,包括电话服务、帮助读取信息等。文章列举了多个TTS产品和应用案例,探讨了TTS的实现方式和断句、音调等技术细节。
最低0.47元/天 解锁文章
1111

被折叠的 条评论
为什么被折叠?



