Mozilla TTS 已经停止更新,所以这里用 Coqui TTS , coqui官网, 开源地址。
git clone https://github.com/coqui-ai/TTS
1.环境
conda create -n t python==3.9#要大于等于3.9
conda activate t
conda install --no-cache-dir pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
pip install -r requirements.txt
python setup.py install#这里如果遇到问题,就去https://visualstudio.microsoft.com/visual-cpp-build-tools/安装一下C++build tools
2.使用
tts --list_models#测试tts是否安装成功,输出模型的信息
tts --model_info_by_name tts_models/tr/common-voice/glow-tts#查看模型信息
tts --text "text for TTS" --out_path ./test_speech.wav#将字符串输出语音,这时会下载模型,如果模型下载失败,去用户的AppData\Local\目录下手动删除tts目录,再次尝试
中文语音:可以去https://github.com/coqui-ai/TTS/releases/tag/v0.6.1_models下载里面的https://github.com/coqui-ai/TTS/releases/download/v0.6.1_models/tts_models–zh-CN–baker–tacotron2-DDC-GST.zip解压后放在用户目录的\AppData\Local\tts
文件夹里面。然后使用这个中文模型测试。
tts --text "知是行之始,行是知之成。" --out_path aaa.wav --model_name tts_models/zh-CN/baker/tacotron2-DDC-GST
python引用
from TTS.api import TTS
tts=TTS("tts_models/zh-CN/baker/tacotron2-DDC-GST")
tts.tts_to_file(text="知是行之始,行是知之成。", file_path="aaa.wav")