#概念 TTS即TextToSpeech,文本转语言,也就是所谓的语音合成技术。TTS技术对文本文件进行实时转换,转换时间可以秒计算。 目前国内主流的语音引擎提供商主要为科大讯飞、百度以及云知声。 #前言 由于项目中涉及到收银金额的播报,主要是用在食堂、大排档这类的嘈杂环境,所以需求上要满足语速快,音量高,队列播放。最初找到网上通过MediaPlayer播放录制好的金额音频文件的方案实现,[参考](segmentfault.com/a/119000001… [代码]:github.com/javaexcepti…
提供商 | 是否提供离线 | 是否收费 | 合成质量 | 不足 |
---|---|---|---|---|
科大讯飞 | 是 | 是 | 好 | 不支持有线网,需维护队列 |
百度 | 是 | 否 | 较好 | 离线授权易失败,合成失败 |
云知声 | 是 | 否 | 一般 | 声音不自然,需维护队列,技术支持不给力 |
最后,结合项目复杂的使用场景,选择了云知声的离线TTS,外加维护一个简单的队列,满足了我们的需求。网上有网友提供的一个自己封装的工具(