ChatTTS 本地部署教程!文字转语音工具!

1.安装Python 和 git环境,python需要 3.9+ 版本,比如我选择python 3.10.6 【点击下载

然后安装下git环境:【官方下载

2.下载 chatTTS-ui  【点击下载

3.解压后在根目录下输入CMD进入终端,然后依次执行下面的安装命令:

python -m venv venv
.\venv\scripts\activate
pip install -r requirements.txt

4.如果不需要CUDA加速,执行

pip install torch==2.1.2 torchaudio==2.1.2

如果需要CUDA加速,执行

pip install torch==2.1.2 torchaudio==2.1.2 --index-url https://download.pytorch.org/whl/cu118

如果你没有安装CUDA+ ToolKit, 可以看下这篇文章:【点击查看

5.最后执行 python app.py 启动,将自动打开浏览器窗口,默认地址 http://127.0.0.1:9966

(注意:默认从 modelscope 魔塔下载模型,不可使用代理下载,请关闭代理)

6.源码部署启动后,会先从 modelscope下载模型,但modelscope缺少spk_stat.pt,会报错,【点击下载 spk_stat.pt

下载后将该文件复制到 项目目录/models/pzc163/chatTTS/asset/ 文件夹内

注意 modelscope 仅允许中国大陆ip下载模型,如果遇到 proxy 类错误,请关闭代理。

如果你希望从 huggingface.co 下载模型,请打开 app.py 查看大约第50行-60行的注释。如果需要GPU加速,必须是英伟达显卡,并且安装 cuda版本的torch

# 默认从 modelscope 下载模型,如果想从huggingface下载模型,请将以下3行注释掉
CHATTTS_DIR = snapshot_download('pzc163/chatTTS',cache_dir=MODEL_DIR)
chat = ChatTTS.Chat()
chat.load_models(source="local",local_path=CHATTTS_DIR)

# 如果希望从 huggingface.co下载模型,将以下注释删掉。将上方3行内容注释掉
#os.environ['HF_HUB_CACHE']=MODEL_DIR
#os.environ['HF_ASSETS_CACHE']=MODEL_DIR
#chat = ChatTTS.Chat()
#chat.load_models()

### 部署TTS文字语音系统的概述 为了在本地服务器上成功部署TTS文字语音系统,需遵循一系列配置和安装过程。此过程涉及软件环境准备、依赖库安装以及特定平台工具集的设置。 #### 准备工作 确保目标机器已安装操作系统并具备互联网连接能力以便下载必要的组件。对于Windows环境下,推荐按照详细的本地部署指南操作[^2]。 #### 安装基础运行环境 针对微软提供的Speech Platform,在Windows平台上部署TTS服务前,需要先完成以下几个关键步骤: - **安装 Microsoft Speech Platform - Server Runtime** 此Runtime提供了执行期间所需的底层支持文件和服务[^3]。 - **安装 Microsoft Speech Platform SDK** SDK包含了开发人员用于构建应用程序接口(APIs)所需的各种资源,包括但不限于API文档、示例代码等。 - **安装 TTS 功能包** 下载对应的语言包来扩展系统的多语言处理能力,特别是当涉及到不同国家和地区用户的交互需求时更为重要。 #### 开发与测试阶段 一旦上述准备工作就绪,则可以着手编写具体的业务逻辑实现部分。如果采用的是像ChatTTS这样的先进框架,那么除了基本的功能外还可以享受到更高质量的声音效果及更好的情感表达特性[^4]。 ```python from chattts import ChatTTS def generate_speech(text, output_path): tts = ChatTTS() audio_data = tts.synthesize(text) with open(output_path, 'wb') as f: f.write(audio_data) if __name__ == "__main__": text_to_convert = "你好,世界" file_name = "./output.wav" generate_speech(text_to_convert, file_name) ``` 这段Python脚本展示了如何利用`ChatTTS`类创建实例对象并通过其方法将给定的文字换为音频流保存至指定路径下。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值