Coqui AI的TTS是一款开源深度学习文本转语音工具,以高质量、多语言合成著称。它提供超过1100种语言的预训练模型库,能够轻松集成到各种应用中,并允许用户通过简单API进行个性化声音训练与微调。其技术亮点包括但不限于低资源适应性(如YourTTS模型可处理有限或零样本数据),实时流式传输功能(支持200毫秒级延迟)以及强大的跨语言克隆能力。
coqui-ai/TTS 案例model文件:
链接:https://pan.quark.cn/s/85518f2c6172
提取码:LrL5
将文件解压到TTS_HOME目录下,也可以通过以下方式配置自己路径:
os.environ.setdefault('TTS_HOME', 'your own path')
os.environ.setdefault('XDG_DATA_HOME', 'your own path')
路径对应参考: