GPT-SoVITS语音克隆入门

主要参考资料:
GPT-SoVITS: 智能语音合成的新境界: https://blog.csdn.net/weixin_36829761/article/details/140169895
你的声音,现在是我的了!- 手把手教你用 GPT-SoVITS 克隆声音!: https://www.bilibili.com/video/BV1P541117yn/?spm_id_from=333.337.search-card.all.click&vd_source=ef5b6d43cf1d4ed823db3e9133e97d2d

一、安装GPT-SoVITS(基于Windows)

二、参数设置

2.0 前置数据集获取工具

0a.准备音频
如果采集的数据里有背景噪声,可以打开UVR5,等待一会,会弹出一个新的页面
在这里插入图片描述

根据文字提示,选择对应的模型,点击转换
在这里插入图片描述
0b.切割音频
修改下输入输出路径,第一次玩其他参数可以先选默认。
在这里插入图片描述
0c.打标
这一步我们获得识别结果,但为了得到更好的效果,下一步我们需要对打标结果进行校正。
在这里插入图片描述
0d.校对
打勾开启打标WebUI,注意文件路径。
在这里插入图片描述
校对完成后保存文件。
在这里插入图片描述

2.1 GPT-SoVITS-TTS

回到顶层,切换到1-GPT-SoVITS-TTS
在这里插入图片描述

2.1.A 训练集格式化工具

继续填好路径,其他可以默认。
在这里插入图片描述
点击一键三连
在这里插入图片描述

2.1.B 微调训练

回到顶部,切换到1B-微调训练
在这里插入图片描述
依次点击 开启SoVITS训练 和 开始GPT训练
在这里插入图片描述

2.1.C 推理

选择两个模型,并开启TTS推理
在这里插入图片描述
这里还需要先上传一个参考音频,可以在切割的音频里选择
在这里插入图片描述

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值