ChatTTS超真实自然的语音合成模型

最新推荐文章于 2024-12-09 23:07:42 发布

我码玄黄

最新推荐文章于 2024-12-09 23:07:42 发布

阅读量792

点赞数 3

分类专栏： AI 探索 github 文章标签： ai TTS github

本文链接：https://blog.csdn.net/qq_30333063/article/details/140051494

版权

AI 探索同时被 2 个专栏收录

50 篇文章

订阅专栏

github

36 篇文章

订阅专栏

项目介绍

ChatTTS是一款专为优化对话场景而生的语音生成模型，尤其匹配大型语言模型（LLM）的交互需求，以及生成对话式音频、视频旁白等应用场景，无缝覆盖中英文双语。

通过汲取约100,000小时的高质量中英语音数据进行深度训练，ChatTTS在语音合成领域彰显出卓越的自然度与逼真效果。

该模型的亮点集中体现在多语言能力、超大规模数据驱动的高保真输出、对LLM对话任务的卓越适配性，以及对未来开源计划的展望。

它不仅跨越语言界限，服务于多元化用户群体，还凭借其百万小时级数据训练的深厚底蕴，确保语音合成既流畅又自然，特别适合融入复杂的对话交互系统。

github 地址：https://github.com/2noise/ChatTTS

项目使用

这里并没有直接使用官方的包，而采用社区开发者制作的一键部署整合包。

此项目基于 ChatTTS ，支持流式输出、音色抽卡、长音频生成和分角色朗读。

github地址：https://github.com/6drf21e/ChatTTS_colab

独有功能

音色抽卡

根据自己的需求选择合适的音色。

长音频生成

分段处理，最终输出的音频是将这些音频段合成后的结果，且支持流式生成音频，一边播放一遍推理。

角色扮演

脚本格式 角色::文本 一行为一句”。

项目安装

1、安装 Conda（如果尚未安装）。

2、打开终端，创建一个新的 conda 环境：

conda create -n "ChatTTS_colab" python=3.11

3、激活刚创建的环境：

conda activate ChatTTS_colab

4、克隆项目仓库到本地：

git clone git@github.com:6drf21e/ChatTTS_colab.git

5、手动安装 ChatTTS 依赖到项目目录：

cd ChatTTS_colab
git clone https://github.com/2noise/ChatTTS
cd ChatTTS
git checkout -q f4c8329
cd ..
mv ChatTTS temp
mv temp/ChatTTS ./ChatTTS
rm -rf temp

6、在项目目录安装 ChatTTS_colab 所需的依赖：

pip install -r requirements-macos.txt

7、运行项目，等待自动下载模型：

python webui_mix.py
# Loading ChatTTS model...

一切正常的话会自动打开浏览器，显示项目介绍中的界面。

– 欢迎点赞、关注、转发、收藏【我码玄黄】，gonghao同名