声音克隆项目GPT-SoVITS-V3项目运行

rancang

已于 2025-03-03 20:04:57 修改

阅读量1k

点赞数 10

文章标签： gpt python

于 2025-03-03 20:03:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rancang/article/details/145997702

版权

项目地址：

RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
把最新的gpt-vits-v3整合包下载一下
![[Pasted image 20250303193419.png]]

解压完后，双击一下go-webui.bat文件，基本就能出现这个页面了。
![[Pasted image 20250303193906.png]]
在这里插入图片描述

模型训练：

提前准备好自己的MP3文件或者WAV文件
如果只有视频文件的话，用这个网站进行转换一下 MP4到MP3转换器- FreeConvert.com

流程参考b站视频：第三代GPT-SoVITS最强声音克隆，只需3秒语音，完美声音复刻+在线免费使用！_哔哩哔哩_bilibili

可以用一下大佬的gpu训练模型
跟着视频走，基本就是训练出模型了，这时候就点击1C-推理，启动WebUI，准备推理。
在这里插入图片描述

这时候如果你想本地去推理的话，可以把谷歌硬盘中的这两个权重模型给下载下来，然后在本地切换成这两个权重模型。
![[Pasted image 20250303194620.png]]

推理：

这里需要填写参考音频（3-10秒）和参考文本。
用一个音频剪切网站稍微剪切一下音频：[在线剪切MP3、AAC、M4A、OGG或WAV音频](https://cdkm.com/cn/cut-audio#g
在这里插入图片描述

ref:

项目地址：https://github.com/RVC-Boss/GPT-SoVITS/releases/tag/20250228v3
b站视频链接：第三代GPT-SoVITS最强声音克隆，只需3秒语音，完美声音复刻+在线免费使用！_哔哩哔哩_bilibili
音频剪切：在线剪切MP3、AAC、M4A、OGG或WAV音频
MP3转换器：MP4到MP3转换器- FreeConvert.com
GPT-SOVITS指南：基础知识

最后再谢谢各位大佬！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。