TTS离线语音合成应用方案【一】

本文介绍了TTS(Text To Speech)技术的基本概念,分析了科大讯飞、百度和云知声等主流语音引擎提供商。针对一个需要在嘈杂环境中快速播报收银金额的项目,详细阐述了为何选择云知声的离线TTS解决方案,并提供了一个简单的队列播放管理。文章分享了自定义的工具类和如何调整音频流类型以提高音量,以及对SDK中离线资源处理的改进方法。文章最后提供了源码下载链接。
摘要由CSDN通过智能技术生成

#概念 TTS即TextToSpeech,文本转语言,也就是所谓的语音合成技术。TTS技术对文本文件进行实时转换,转换时间可以秒计算。 目前国内主流的语音引擎提供商主要为科大讯飞、百度以及云知声。 #前言 由于项目中涉及到收银金额的播报,主要是用在食堂、大排档这类的嘈杂环境,所以需求上要满足语速快,音量高,队列播放。最初找到网上通过MediaPlayer播放录制好的金额音频文件的方案实现,[参考](segmentfault.com/a/119000001… [代码]:github.com/javaexcepti…

提供商 是否提供离线 是否收费 合成质量 不足
科大讯飞 不支持有线网,需维护队列
百度 较好 离线授权易失败,合成失败
云知声 一般 声音不自然,需维护队列,技术支持不给力

最后,结合项目复杂的使用场景,选择了云知声的离线TTS,外加维护一个简单的队列,满足了我们的需求。网上有网友提供的一个自己封装的工具(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值