官方链接内容整理的 Spark-TTS Windows 安装完整流程

官方链接内容整理的 Spark-TTS Windows 语音克隆 安装完整流程

官方链接内容整理的 Spark-TTS Windows 安装完整流程

Spark TTS:基于大型语言模型的文本转语音模型
Spark-TTS 是一个先进的文本转语音系统,利用大型语言模型(LLM)的强大功能,实现高度准确和自然的声音合成。它被设计为高效、灵活且强大,适用于研究和生产用途。

Inference Overview of Voice Cloning

spark tts infer voice cloning

Inference Overview of Controlled Generation

spark tts infer control

楼主整合好的资源包,免加速,已缓存好的项目,提供不限速链接:
—链接: https://caiyun.139.com/m/i?2mD8SUatQ1y60
/*594n8cMmVZh1:/
复制本段信息,打开「中国移动云盘APP」获取。人人不限速,移动用户免流量!

Spark-TTS Windows 安装指南

1. 安装 Conda

• 下载并安装 Miniconda 或 Anaconda
重要:安装时勾选 Add Conda to PATH(将 Conda 添加到系统环境变量)。

我的这一步没有环境变量配置,请手动装配
在这里插入图片描述

2. 下载 Spark-TTS

选择以下任一方式
推荐(手动下载)

  1. 访问 GitHub 仓库:SparkAudio/Spark-TTS
  2. 点击 Code > Download ZIP,解压到本地文件夹。
    可选(使用 Git)
git clone https://github.com/SparkAudio/Spark-TTS.git
3. 创建 Conda 环境

打开 命令提示符(cmd),依次执行:

conda create -n sparktts python=3.11 -y
conda activate sparktts

为什么替换为3.11
安装过程遇到错误:
pip 无法从指定的 PyTorch 旧版本索引中找到适合你当前环境的 torch 包。这通常是由于 ​​Python 版本不兼容​​ 或 ​​CUDA 环境问题​​ 导致的。以下是解决方案:
检查 Python 版本​​
PyTorch 对 Python 版本有严格限制:
​​PyTorch 2.0+​​ 需要 Python 3.8-3.11(​​不支持 Python 3.12​​)。

4. 安装依赖

进入 Spark-TTS 文件夹(解压或克隆的目录),运行:

pip install -r requirements.txt
5. 安装 PyTorch

自动检测 CUDA版本(推荐):

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
6. 下载模型

选择以下任一方式
推荐(Python 脚本下载)

  1. 在 Spark-TTS 文件夹中创建 download_model.py 文件,粘贴以下代码:
    from huggingface_hub import snapshot_download
    import os
    
    model_dir = "pretrained_models/Spark-TTS-0.5B"
    if os.path.exists(model_dir) and len(os.listdir(model_dir)) > 0:
        print("Model files already exist. Skipping download.")
    else:
        print("Downloading model files...")
        snapshot_download(
            repo_id="SparkAudio/Spark-TTS-0.5B",
            local_dir=model_dir,
            resume_download=True  # 支持断点续传
        )
        print("Download complete!")
    
  2. 运行脚本:
    python download_model.py
    ```![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/cb101a9282c34a888542fc1717237865.png)
    
    

可选(Git 下载)

mkdir pretrained_models
git clone https://huggingface.co/SparkAudio/Spark-TTS-0.5B pretrained_models/Spark-TTS-0.5B
7. 运行 Web UI

启动交互式网页界面:

python webui.py

• 浏览器访问生成的本地地址(通常是 http://127.0.0.1:7860)即可使用 TTS 功能。

此处楼主遇到了numpy 版本问题可供参考
—1. ​​降级 numpy 到兼容版本​​
powershell
pip install “numpy<2.0” --force-reinstall
这会安装最新的 1.x 版本(如 1.26.4),兼容大多数科学计算库。
2. ​​重新安装冲突的包​​
降级 numpy 后,重新安装依赖冲突的包:
powershell
pip install --force-reinstall contourpy gensim numba
3. ​​验证安装​​
检查 numpy 版本是否已降级:
powershell
python -c “import numpy; print(numpy.version)”
应输出 1.x.x(如 1.26.4)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值