手把手教程 | 云端部署语音合成神器——ChatTTS

virtaitech

于 2024-06-20 14:11:52 发布

阅读量1.5k

点赞数 3

文章标签：语音识别人工智能

本文链接：https://blog.csdn.net/m0_49711991/article/details/139831217

版权

近期，ChatTTS 凭借其高度仿真的 AI 语音合成技术迅速走红！ChatTTS 是专为对话场景设计的文本转语音模型，例如 LLM 助手对话任务，支持中英文两种语言。其最大的模型在超过 10 万小时的中英文数据上进行训练，确保了高质量的语音输出。

从宣传视频中可以发现，合成语音自动添加了“嗯……”“然后”等语气词，以及适时的笑声，展现了丰富的韵律和情感，几乎无法分辨真假。

本文将手把手指导大家如何在趋动云平台部署这款开源的语音合成神器——ChatTTS，并进行实际测试，体验其强大的功能。让我们一起探索 ChatTTS 的魅力吧！

创建项目

创建项目ChatTTS(名字可自定义)，选择合适的镜像ChatTTS同济子豪兄镜像和模型ChatTTS模型-同济子豪兄。在相应的位置根据关键词搜索公开即可。

完成配置之后，点击我要上传代码，暂不启动。

进入编辑，删除自带的Notebook，上传代码压缩包、解压压缩包，完成编辑。

代码压缩包可以在人工智能小技巧公众号后台回复【ChatTTS】获得。

删除

上传

解压

进入开发环境

启动并进入开发环境，我们可以在 Jupyterlab 进行数据和文件的查看、代码的编辑和运行。

使用趋动云平台，直接运行C代码。C代码中有四个命令，我们只需要Shift+回车，运行import os、os.chdir('ChatTTS')、!python webui.py --local_path=/gemini/pretrain这三个命令即可启动 WebUI 在线网页。

这里有两处代码的修改，如下：

将第107行加上compile=False参数，让模型更快

chat.load_models('local', local_path=args.local_path, compile=False)

将第109行加上share=True参数，生成公网链接

demo.launch(server_name=args.server_name, server_port=args.server_port, inbrowser=True, share=True)

运行完成后，我们获得了一个公网链接（允许所有联网用户查看）和一个端口为8080的本地链接。通过对端口进行设置，本地链接也可以转换为外部访问链接，同样可以达到所有人都能查看的效果。