【GitHub项目推荐--TTS】【转载】

GPT-SoVITS是一个开源声音克隆工具,通过少量样本实现快速且高质量的文本到语音转换。Bark则是Suno的开源文本到音频模型,不仅能生成语音,还能创作音乐和音效,具有跨语言支持和商业使用许可。这两个模型展示了AI在音频生成领域的突破,适合商业应用和个性化内容创作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

GPT-SoVITS

GPT-SoVITS 是一个开源黑科技,只需要 1 分钟的语音就能实现声音克隆、文本到语音转换。少量样本就可以训练出一个优秀的 TTS 模型。

它具有以下主要特性: 

  • 零样本 TTS:输入 5 秒的声音样本,即可体验即时的文本到语音转换。 

  • 少样本 TTS:只需 1 分钟的训练数据,就可以微调模型,以提高语音相似度和真实感。 

跨语言支持:可以用与训练数据集不同的语言进行推理,目前支持英语、日语和中文。集成了一些工具,包括声音伴奏分离、自动训练集分割、中文 ASR 和文本标签,帮助初学者创建训练数据集和 GPT/SoVITS 模型。

开源地址:https://github.com/RVC-Boss/GPT-SoVITS

Bark   开源文本转语音!

Bark 是 Suno 的开源文本转语音+模型;开源协议MIT,可以用来商业化!!

github源代码:

https://github.com/suno-ai/bark

国内源代码:

http://www.gitpp.com/pythonking/bark

Bark的介绍

Bark 是由 Suno 开源的一个文本转语音(Text-to-Speech, TTS&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值