目录
coqui-aiTTS是一个开源的文本转语音(TTS)项目,旨在提供高质量的声音克隆和语音合成功能。它利用深度学习技术,能够模仿特定说话人的声音特征,实现个性化的语音输出。该项目支持多语言,并提供了训练工具,允许用户使用自己的数据集来创建定制的TTS模型。coqui-aiTTS的目标是为开发者和研究者提供一个灵活、强大的TTS解决方案,可用于各种应用场景,如虚拟助手、有声读物或个性化语音界面等。(CUDA驱动11.8)
2.1 (Conda方式安装)Python安装(3.8版本)
2.2 PyTorch (for CUDA support)
6.2 stft requires the return_complex parameter
6.3 ValueError: [!] Model file not found in the output path
6.4 timeout('_ssl.c:1114: The handshake operation timed out'))
一 coqui-aiTTS简介
1.1 coqui-aiTTS简介
coqui-aiTTS是一个开源的文本转语音(TTS)项目,旨在提供高质量的声音克隆和语音合成功能。它利用深度学习技术,能够模仿特定说话人的声音特征,实现个性化的语音输出。该项目支持多语言,并提供了训练工具,允许用户使用自己的数据集来创建定制的TTS模型。coqui-aiTTS的目标是为开发者和研究者提供一个灵活、强大的TTS解决方案,可用于各种应用场景,如虚拟助手、有声读物或个性化语音界面等。(CUDA驱动11.8)
1.2 oqui-aiTTS项目开源地址
这个是github 上一个比较火的开源项目:GitHub - coqui-ai/TTS: 🐸💬 - a deep learning toolkit for Text-to-Speech, battle-tested in research and production
项目说明文档如下:TTS 0.22.0 documentation
二 依赖基础环境搭建
2.1 (Conda方式安装)Python安装(3.8版本)
conda create -n ttsenv python=3.8.10
首先安装conda,然后运行上面的命令,出现下面的情况,直接输出y。就可以安装指定版本的Python环境。
安装成功入下图所示。
输入:conda activate ttsenv 激活环境。
前缀显示如图,在表示进入指定的虚拟环境,这个环境和系统的python环境是隔离的。
2.2 PyTorch (for CUDA support)
进入下面的链接:Start Locally | PyTorch
选择适合自己的。
页面显示如下图所示:
复制其中的安装命令:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
成功安装页面显示:
验证是否成功安装
CMD终端输入:pip list,成功安装如图所示。
2.3 eSpeak NG 安装
eSpeak NG 安装地址如下:
Microsoft C++ 生成工具 - Visual Studio
CSDN:https://download.csdn.net/download/sdfghwijiebvnd/89664356
显示页面如下:
2.4 Coqui TTS代码下载和安装
1. Coqui TTS代码下载
如果网络环境比较好,直接使用git下载指定版本。
git clone GitHub - coqui-ai/TTS: 🐸💬 - a deep learning toolkit for Text-to-Speech, battle-tested in research and production(建议使用0.11.1,不然很可能需要的是Python 3.9以上版本)
如果网络环境不行,可以使用CSDN下载好的资源。
CSDN:https://download.csdn.net/download/sdfghwijiebvnd/89664369
- Coqui TTS安装
解压并进入项目文件夹,TTS-0.11.1
cd TTS-0.11.1
安装TTS命令:
pip install -e .
安装成功输出如图所示: