官方链接内容整理的 Spark-TTS Windows 安装完整流程

诗与远方ShiYuYuanFang

已于 2025-04-13 10:54:48 修改

阅读量1.4k

点赞数 21

文章标签： github 开源软件 ai

于 2025-04-13 09:37:29 首次发布

本文链接：https://blog.csdn.net/asd2580147369/article/details/147172661

版权

官方链接内容整理的 Spark-TTS Windows 语音克隆安装完整流程

官方链接内容整理的 Spark-TTS Windows 安装完整流程：

Spark TTS：基于大型语言模型的文本转语音模型
Spark-TTS 是一个先进的文本转语音系统，利用大型语言模型（LLM）的强大功能，实现高度准确和自然的声音合成。它被设计为高效、灵活且强大，适用于研究和生产用途。

Inference Overview of Voice Cloning

spark tts infer voice cloning

Inference Overview of Controlled Generation

spark tts infer control

楼主整合好的资源包，免加速，已缓存好的项目，提供不限速链接：
—链接: https://caiyun.139.com/m/i?2mD8SUatQ1y60
/*594n8cMmVZh1:/
复制本段信息，打开「中国移动云盘APP」获取。人人不限速，移动用户免流量！

Spark-TTS Windows 安装指南

1. 安装 Conda

• 下载并安装 Miniconda 或 Anaconda。
• 重要：安装时勾选 Add Conda to PATH（将 Conda 添加到系统环境变量）。

我的这一步没有环境变量配置，请手动装配
在这里插入图片描述

2. 下载 Spark-TTS

选择以下任一方式：
• 推荐（手动下载）：

访问 GitHub 仓库：SparkAudio/Spark-TTS
点击 Code > Download ZIP，解压到本地文件夹。
• 可选（使用 Git）：

git clone https://github.com/SparkAudio/Spark-TTS.git

3. 创建 Conda 环境

打开 命令提示符（cmd），依次执行：

conda create -n sparktts python=3.11 -y
conda activate sparktts

为什么替换为3.11？
安装过程遇到错误：
pip 无法从指定的 PyTorch 旧版本索引中找到适合你当前环境的 torch 包。这通常是由于 Python 版本不兼容或 CUDA 环境问题导致的。以下是解决方案：
检查 Python 版本
PyTorch 对 Python 版本有严格限制：
PyTorch 2.0+ 需要 Python 3.8-3.11（不支持 Python 3.12）。

4. 安装依赖

进入 Spark-TTS 文件夹（解压或克隆的目录），运行：

pip install -r requirements.txt

5. 安装 PyTorch

• 自动检测 CUDA版本（推荐）：

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

6. 下载模型

选择以下任一方式：
• 推荐（Python 脚本下载）：

在 Spark-TTS 文件夹中创建 download_model.py 文件，粘贴以下代码：

from huggingface_hub import snapshot_download
import os

model_dir = "pretrained_models/Spark-TTS-0.5B"
if os.path.exists(model_dir) and len(os.listdir(model_dir)) > 0:
    print("Model files already exist. Skipping download.")
else:
    print("Downloading model files...")
    snapshot_download(
        repo_id="SparkAudio/Spark-TTS-0.5B",
        local_dir=model_dir,
        resume_download=True  # 支持断点续传
    )
    print("Download complete!")

运行脚本：

python download_model.py
```![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/cb101a9282c34a888542fc1717237865.png)

• 可选（Git 下载）：

mkdir pretrained_models
git clone https://huggingface.co/SparkAudio/Spark-TTS-0.5B pretrained_models/Spark-TTS-0.5B

7. 运行 Web UI

启动交互式网页界面：

python webui.py

• 浏览器访问生成的本地地址（通常是 http://127.0.0.1:7860）即可使用 TTS 功能。

此处楼主遇到了numpy 版本问题可供参考
—1. 降级 numpy 到兼容版本
powershell
pip install “numpy<2.0” --force-reinstall
这会安装最新的 1.x 版本（如 1.26.4），兼容大多数科学计算库。
2. 重新安装冲突的包
降级 numpy 后，重新安装依赖冲突的包：
powershell
pip install --force-reinstall contourpy gensim numba
3. 验证安装
检查 numpy 版本是否已降级：
powershell
python -c “import numpy; print(numpy.version)”
应输出 1.x.x（如 1.26.4）。