GPT-SoVITS
GPT-SoVITS 是一个开源黑科技,只需要 1 分钟的语音就能实现声音克隆、文本到语音转换。少量样本就可以训练出一个优秀的 TTS 模型。
它具有以下主要特性:
-
零样本 TTS:输入 5 秒的声音样本,即可体验即时的文本到语音转换。
-
少样本 TTS:只需 1 分钟的训练数据,就可以微调模型,以提高语音相似度和真实感。
跨语言支持:可以用与训练数据集不同的语言进行推理,目前支持英语、日语和中文。集成了一些工具,包括声音伴奏分离、自动训练集分割、中文 ASR 和文本标签,帮助初学者创建训练数据集和 GPT/SoVITS 模型。
开源地址:https://github.com/RVC-Boss/GPT-SoVITS
Bark 开源文本转语音!
Bark 是 Suno 的开源文本转语音+模型;开源协议MIT,可以用来商业化!!
github源代码:
https://github.com/suno-ai/bark
国内源代码:
http://www.gitpp.com/pythonking/bark
Bark的介绍
Bark 是由 Suno 开源的一个文本转语音(Text-to-Speech, TTS&