Fish Speech 是由 Fish Audio 团队开发的一款开源文本转语音(TTS)模型,它在多语言支持和性能方面取得了显著的突破。根据证据显示,Fish Speech 最新版本为 1.4 版本,该版本不仅提升了对多种语言的支持,还大幅优化了处理速度和延迟。
要在本地成功部署并运行 Fish-Speech 项目,请按照以下步骤操作:
Windows 设置
1. 创建 Python 虚拟环境
conda create -n fish-speech python=3.10
conda activate fish-speech
2. 安装 PyTorch
手动安装大版本:
pip install D:\xxx\fish-speech-libs\torch-2.4.1+cu121-cp310-cp310-win_amd64.whl --index-url https://pypi.org/simple -v
然后安装小版本:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
如果需要使用清华源(可能会下载失败):
pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple
3. 安装 Fish-Speech
pip3 install -e .
如果安装时提示清华源冲突,请先卸载清华源,或屏蔽 pip.ini
文件中的相关配置。
4. (可选)安装 Triton 加速
手动安装 Triton:
pip install D:\xxx\fish-speech-libs\triton_windows-0.1.0-py3-none-any.whl --index-url https://pypi.org/simple -v
或通过 GitHub 安装:
pip install https://github.com/AnyaCoder/fish-speech/releases/download/v0.1.0/triton_windows-0.1.0-py3-none-any.whl
注意: 启动前,请确保下载模型文件 model.pth
和 firefly-gan-vq-fsq-8x1024-21hz-generator.pth
,并放置在以下路径:
D:\workspace\github\fish-speech\fish-speech-main\checkpoints\fish-speech-1.4
5. 运行项目
双击 start.bat
启动训练推理 WebUI 管理界面。
6. 使用 WebUI 进行训练推理
- 点击 🧠 推理配置 页签,勾选“打开推理服务器”,显示推理界面已在 http://127.0.0.1:7862 上启动。
- 访问该页面即可进入推理界面使用。
最后,访问 http://localhost:7860 打开 WebUI 界面。
按照以上步骤,您应该能够在本地成功部署并运行 Fish-Speech 项目。
GitHub 地址
您可以在以下链接找到项目的 GitHub 地址:Fish-Speech GitHub
声明
此代码库和所有模型均根据 CC-BY-NC-SA-4.0 许可证发布。请参阅许可证了解更多详细信息。
对于任何非法使用代码库的行为,我们不承担任何责任。请参阅您当地有关 DMCA 的法律和其他相关法律。