Comfyui-ChatTTS-OpenVoice 为ComfyUI添加语音合成、语音克隆功能

shadowcz007

于 2024-06-23 19:14:37 发布

阅读量616

点赞数 7

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shadowcz007/article/details/139910162

版权

‍‍

生成多人播客：

Comfyui-ChatTTS是一个开源的GitHub项目，致力于为ComfyUI添加语音合成功能。该项目提供了一系列功能强大的节点和模型，支持用户创建和复用音色，支持多人对话模式的生成，并提供了导出音频字幕文件的功能。

项目包含多个关键节点，如ChatTTS、Multi Person Podcast、CreateSpeakers，以及SaveSpeaker和LoadSpeaker，后者使得音色的保存和加载变得非常方便。用户可以通过这些节点生成多角色的对话音频，并在需要时复用先前创建的音色。此外，项目还提供了Load Whisper Model和Whisper Transcribe节点，这些节点可以方便地将音频文件转录为字幕文本文件。

一个显著的特点是项目支持OpenVoiceClone节点，这使得音色迁移更加容易，从而更好地控制角色的声音。用户可以通过加载不同的模型和音色文件，实现对角色声音的精细控制。

模型文件可以从Hugging Face平台下载并放置在指定的文件夹中，如models/chat_tts、models/chat_tts_speaker、models/open_voice和models/whisper/large-v3。

项目还包含一个课程示例代码，以ChatTTS为例，展示了如何为ComfyUI增加语音合成功能。这个示例代码详细介绍了自定义节点的实现方法，包括后端Python代码的编写和节点界面的修改。

通过该项目，用户可以在ComfyUI中实现复杂的语音合成任务，创建个性化的音色和对话模式，并且能够方便地导出音频和字幕文件。项目的开放性和强大的功能使其成为语音合成领域的一个重要工具。

https://github.com/shadowcz007/Comfyui-ChatTTS

备注：comfyui

‍

‍

关注

7
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Comfyui-ChatTTS-OpenVoice 为ComfyUI添加语音合成、语音克隆功能

‍‍生成多人播客：Comfyui-ChatTTS是一个开源的GitHub项目，致力于为ComfyUI添加语音合成功能。该项目提供了一系列功能强大的节点和模型，支持用户创建和复用音色，支持多人对话模式的生成，并提供了导出音频字幕文件的功能。项目包含多个关键节点，如ChatTTS、Multi Person Podcast、CreateSpeakers，以及SaveSpeaker和LoadSpeaker...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。