SO-VITS-SVC 尝试

最新推荐文章于 2025-05-07 20:00:25 发布

McQueen_Zero

最新推荐文章于 2025-05-07 20:00:25 发布

阅读量2k

点赞数 3

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/qq_43822323/article/details/129517724

版权

3 篇文章

订阅专栏

参考教程。
记录一些要点：

UVR5-分离伴奏：Method-Demucs、Stem-Vocals、Model-v3|UVR-Model-1、GPU Conversion √、Vocals Only √
UVR5-消除混响和声：Input-vocal、Method-VR、Size-320、Aggression-10、Model-5_HP_Karaoke_UVR、GPU Conversion √、Vocals Only √
Renamer-文件批量改名：建议只包含字母、数字、下划线
AudioSlicer-音频切分：第2步处理好的纯人声拖入Task List里，Minimum Length改成8000，目标文件夹名称建议为需要训练的音声人物名
上一步的文件夹放入整合so-vits-svc-4.0/dataset_raw/，运行数据预处理，dataset文件夹里为预处理好的数据集，filelists文件夹里为自动划分的训练集、验证集、测试集标注

改配置文件：so-vits-svc-4.0/configs/config.json，12G显存RTX3080Ti设置(learning_rate: 0.0002, batch_size: 12)，两者正比；24G显存RTX3090设置(learning_rate: 0.0004, batch_size: 24)
评估结果一组随机抽5个数，越小越好；每训练200个Step，保存一次G/D.pth模型文件
训练.bat