项目地址:
RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
把最新的gpt-vits-v3整合包下载一下
解压完后,双击一下go-webui.bat文件,基本就能出现这个页面了。
模型训练:
提前准备好自己的MP3文件或者WAV文件
如果只有视频文件的话,用这个网站进行转换一下 MP4到MP3转换器- FreeConvert.com
流程参考b站视频:第三代GPT-SoVITS最强声音克隆,只需3秒语音,完美声音复刻+在线免费使用!_哔哩哔哩_bilibili
可以用一下大佬的gpu训练模型
跟着视频走,基本就是训练出模型了,这时候就点击1C-推理,启动WebUI,准备推理。
这时候如果你想本地去推理的话,可以把谷歌硬盘中的这两个权重模型给下载下来,然后在本地切换成这两个权重模型。
推理:
这里需要填写参考音频(3-10秒)和参考文本。
用一个音频剪切网站稍微剪切一下音频:[在线剪切MP3、AAC、M4A、OGG或WAV音频](https://cdkm.com/cn/cut-audio#g
ref:
- 项目地址:https://github.com/RVC-Boss/GPT-SoVITS/releases/tag/20250228v3
- b站视频链接:第三代GPT-SoVITS最强声音克隆,只需3秒语音,完美声音复刻+在线免费使用!_哔哩哔哩_bilibili
- 音频剪切:在线剪切MP3、AAC、M4A、OGG或WAV音频
- MP3转换器:MP4到MP3转换器- FreeConvert.com
- GPT-SOVITS指南:基础知识
最后再谢谢各位大佬!