VITS训练自己的AI歌手

我是小z呀

已于 2023-05-12 08:41:10 修改

阅读量904

点赞数 1

分类专栏： AIGC 文章标签：人工智能深度学习机器学习

于 2023-05-11 17:08:35 首次发布

本文链接：https://blog.csdn.net/weixin_38226321/article/details/130623403

版权

AIGC 专栏收录该内容

48 篇文章 3 订阅

订阅专栏

文章介绍了如何利用现成的AI工具包VITS-SVC4.0训练个人的AI歌手，如孙燕姿或Leslie。首先，需要收集wav格式的音频数据，使用UVR5模型去除伴奏和混响。接着，在设置好参数后，通过WebUI进行训练。尽管作者遇到本地训练问题，但建议尝试使用云服务。文中提供了相关教程链接和视频参考。

摘要由CSDN通过智能技术生成

最近大火的AI孙燕姿真是好玩，大佬们把训练工作做成了集成包，不用配环境，上手即用，跟着大佬训练了自己喜欢的Leslie，顺便写一下笔记，喜欢的可以参考，最后一章附上大佬们的视频链接和文章链接。

1.准备音频数据集

1.首先是下载自己喜欢的歌手的音乐，最好要wav格式的，https://www.xmwav.com/，这个里面歌不多，在这里下载了mp4文件，也可以用https://www.aconvert.com/cn/audio/mp4-to-wav/转换成wav格式，不过有可能文件损坏。（也可以找别的资源，这里列的只是我用的）。
2.拿到wav音源之后开始提取干净的人声,首先把下载的模型文件复制到用UVR5的下载目录的Ultimate Vocal Remover\models下，然后运行UVR5，要分两步进行，参数设置如下：请添加图片描述
首先是分离伴奏

然后消除混响和声

运行slicer-gui对人声进行切片处理，一般处理到3~15秒。

2.训练并推理

把处理好的数据文件夹放到so-vits-svc\dataset_raw文件夹下面，运行启动webui.bat，设置参数进行训练与推理。
加载数据
请添加图片描述

调参数开始训练模型

电脑不行，一晚上就崩了，下午用云服务试一试。

3.参考链接

[1]https://docs.qq.com/doc/DUWdxS1ZaV29vZnlV
[2]https://www.bilibili.com/video/BV1H24y187Ko/?spm_id_from=333.1007.top_right_bar_window_history.content.click&vd_source=e99f85042059f2864f5cca20d71575f0
[3]https://www.bilibili.com/video/BV1Eb411f7gX/?spm_id_from=333.1007.top_right_bar_window_history.content.click&vd_source=e99f85042059f2864f5cca20d71575f0