使用GPT-Sovits模型训练ai声音小白向教程

最新推荐文章于 2025-04-15 10:41:42 发布

特蕾西娅今天也在迷茫

最新推荐文章于 2025-04-15 10:41:42 发布

阅读量2.2k

点赞数 24

文章标签： gpt 人工智能 ai

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_79645836/article/details/143367257

版权

引言

随着ai对我们生活的影响越来越深，使用ai来便利我们的生活也变得越来越常见。其中，ai声音作为应用技术比较成熟，使用门槛比较低的技术，值得大家花一点时间学习使用。

q：我学会这个能干什么？

a：可以自定声音模型，接入unity游戏中和chat实现对话等，也可以在做视频等时提供方便的免费配音，也可以自娱自乐~~搞二次元老婆~~。

模型介绍

gpt-sovits是一个相对而言体量较小，具备完整的图形化ui，学习门槛极低的模型，只需要约5分钟的声音原始数据，就可以获得效果不错的训练结果，训练过程很快，等待时间少，不容易出错。

模型下载：

由于模型需要和自己的显卡型号匹配，且版本众多，因此本教程不提供模型的下载，可以去百度贴吧或bilibili等寻找合适的模型。

使用UVR5进行降噪处理

下载原始素材

在训练之前，我们需要先准备好一定的原始素材，常见的声音格式都可以。这里我以明日方舟wiki上下载的声音集作为展示。把下载好的声音放在新建文件夹里，这个文件夹就是我们训练每一个步骤的结果集，因此每一个步骤都需要设置一个文件夹来区分。

原始素材需要单独放一个文件夹：

这样就算下载好了。

使用uvr5模型进行背景音乐分离、去混响处理

打开gpt-sovits模型的文件夹，找到go-webui.bat这个文件，打开。唤出终端后会稍微卡一段时间，然后ui界面就会出现在你的浏览器里。

一旦打开web界面，就绝对不能关闭终端，接下来的整个流程都需要保证你的终端是挂在后台的！

我们的前置工作还没有做完。虽然我在wiki下载的声音很纯净，但如果你用的是录音机或是其他方式&#

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。