最近大火的AI孙燕姿真是好玩,大佬们把训练工作做成了集成包,不用配环境,上手即用,跟着大佬训练了自己喜欢的Leslie,顺便写一下笔记,喜欢的可以参考,最后一章附上大佬们的视频链接和文章链接。
1.准备音频数据集
1.首先是下载自己喜欢的歌手的音乐,最好要wav格式的,https://www.xmwav.com/,这个里面歌不多,在这里下载了mp4文件,也可以用https://www.aconvert.com/cn/audio/mp4-to-wav/转换成wav格式,不过有可能文件损坏。(也可以找别的资源,这里列的只是我用的)。
2.拿到wav音源之后开始提取干净的人声,首先把下载的模型文件复制到用UVR5的下载目录的Ultimate Vocal Remover\models下,然后运行UVR5,要分两步进行,参数设置如下:
首先是分离伴奏
然后消除混响和声
运行slicer-gui对人声进行切片处理,一般处理到3~15秒。
2.训练并推理
把处理好的数据文件夹放到so-vits-svc\dataset_raw文件夹下面,运行启动webui.bat,设置参数进行训练与推理。
加载数据
调参数开始训练模型
电脑不行,一晚上就崩了,下午用云服务试一试。
3.参考链接
[1]https://docs.qq.com/doc/DUWdxS1ZaV29vZnlV
[2]https://www.bilibili.com/video/BV1H24y187Ko/?spm_id_from=333.1007.top_right_bar_window_history.content.click&vd_source=e99f85042059f2864f5cca20d71575f0
[3]https://www.bilibili.com/video/BV1Eb411f7gX/?spm_id_from=333.1007.top_right_bar_window_history.content.click&vd_source=e99f85042059f2864f5cca20d71575f0