【GitHub项目推荐--TTS】【转载】

旅之灵夫

已于 2024-02-03 14:13:15 修改

阅读量1.9k

点赞数 6

分类专栏： GitHub项目推荐 TTS 文章标签： github

于 2024-01-30 20:51:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/j8267643/article/details/135941203

版权

GPT-SoVITS是一个开源声音克隆工具，通过少量样本实现快速且高质量的文本到语音转换。Bark则是Suno的开源文本到音频模型，不仅能生成语音，还能创作音乐和音效，具有跨语言支持和商业使用许可。这两个模型展示了AI在音频生成领域的突破，适合商业应用和个性化内容创作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

GPT-SoVITS

GPT-SoVITS 是一个开源黑科技，只需要 1 分钟的语音就能实现声音克隆、文本到语音转换。少量样本就可以训练出一个优秀的 TTS 模型。

它具有以下主要特性：

零样本 TTS：输入 5 秒的声音样本，即可体验即时的文本到语音转换。
少样本 TTS：只需 1 分钟的训练数据，就可以微调模型，以提高语音相似度和真实感。

跨语言支持：可以用与训练数据集不同的语言进行推理，目前支持英语、日语和中文。集成了一些工具，包括声音伴奏分离、自动训练集分割、中文 ASR 和文本标签，帮助初学者创建训练数据集和 GPT/SoVITS 模型。

开源地址：https://github.com/RVC-Boss/GPT-SoVITS

Bark 开源文本转语音!

Bark 是 Suno 的开源文本转语音+模型；开源协议MIT，可以用来商业化！！

github源代码：

https://github.com/suno-ai/bark

国内源代码：

http://www.gitpp.com/pythonking/bark

Bark的介绍

Bark 是由 Suno 开源的一个文本转语音（Text-to-Speech, TTS&

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。