TTS引擎用于实现文本到语音的转换。随着人工智能的普及以及数字设备应用的增加,相关系统对语音识别以及文语转换技术日益依赖,TTS正在变得越来越重要。
在这项技术的帮助下,可以将文本内容转换为录音。可以帮助视觉障碍的人理解文本内容,可以让开车的人听取一个文本工作报告,甚至模拟某个人的声音播报一段内容、演唱一个歌曲,实现虚拟主播、虚拟歌手。
本文主要查找收集了一些较好的开源TTS引擎。这些项目有助于我们更加了解TTS的功能。
01
CoQui TTS
https://github.com/coqui-ai/TTS
这是一个在研究和生产中经过了实战考验的TTS深度学习工具包,可以以200毫秒的延迟进行流传输,支持13种语言(包括中文)。
02
mozilla TTS
https://github.com/mozilla/TTS
TTS是一个用于文本到语音生成的高级库。旨在实现易于训练、高速度和高质量的最佳平衡。 提供预训练模型,以及用于测量数据集质量的工具,支持用于产品和研究的20多种语言,包括支持中文。
03
OpenTTS
https://github.com/synesthesiam/opentts
OpenTTS是TTS最有效的开源模型之一。因为该模型支持包括中文在内的多种语言。
04
MaryTTS
https://github.com/marytts/marytts
MARY Text-to-Spee