SO-VITS-SVC 尝试

参考教程
记录一些要点:

  • 数据集预处理
  1. UVR5-分离伴奏:Method-Demucs、Stem-Vocals、Model-v3|UVR-Model-1、GPU Conversion √、Vocals Only √
  2. UVR5-消除混响和声:Input-vocal、Method-VR、Size-320、Aggression-10、Model-5_HP_Karaoke_UVR、GPU Conversion √、Vocals Only √
  3. Renamer-文件批量改名:建议只包含字母、数字、下划线
  4. AudioSlicer-音频切分:第2步处理好的纯人声拖入Task List里,Minimum Length改成8000,目标文件夹名称建议为需要训练的音声人物名
  5. 上一步的文件夹放入整合so-vits-svc-4.0/dataset_raw/,运行数据预处理,dataset文件夹里为预处理好的数据集,filelists文件夹里为自动划分的训练集、验证集、测试集标注
  • 训练
  1. 改配置文件:so-vits-svc-4.0/configs/config.json,12G显存RTX3080Ti设置(learning_rate: 0.0002, batch_size: 12),两者正比;24G显存RTX3090设置(learning_rate: 0.0004, batch_size: 24)
  2. 评估结果一组随机抽5个数,越小越好;每训练200个Step,保存一次G/D.pth模型文件
  3. 训练.bat
  • 推理
  1. 推理webui.bat
  2. 目标人音声也须分离伴奏、消除混响和声、切片,但切片用AU切即可(保存成wav格式)
  3. 转换完后用AU拼接,用PR合成音频伴奏
  • 聚类模型/自动f0预测

  • 适合我推的歌,且她没唱过

    • 富士山下 - 陈奕迅
      • 用AU变调音频后再合成视频
      • 制作输出格式改成1080P HD
      • 再对齐下音轨,后期有点抢拍
    • 处处吻 - 杨千嬅:单声道音轨不对齐,对拍对应伴奏的强拍
    • 可惜我是水瓶座 - 杨千嬅:转双声道
    • 小幸运 - 田馥甄:转双声道,几处歌词第一个字尖锐爆音,重新转换也不行,标记这些选段使用AU的自动修复选区处理
    • 好きだから。 - ユイカ:转双声道,悄悄话声单独转换

    总结:混音多,消的不干净的歌,转换声线适合只放单声道的;反之,可以放双声道的立体感强。

<think>好的,我现在需要帮助用户解决在AMD显卡上运行so-vits-svc的问题,以及相关的兼容性和性能优化。首先,我得回顾一下用户提供的引用内容。引用[1]提到了NVIDIA驱动的安装和卸载,这说明用户可能之前尝试过在NVIDIA显卡上使用,但现在转向AMD,所以需要AMD的支持。引用[2]是关于so-vits-svc的使用教程,其中提到扩散模型和So-VITS模型的独立性,可能意味着即使硬件不同,某些部分仍可运行。 首先,我应该考虑so-vits-svc的官方文档是否支持AMD显卡。通常,深度学习框架如PyTorch或TensorFlow对AMD的支持依赖于ROCm,而不是CUDA。用户需要确认他们的AMD显卡是否在ROCm的支持列表中。比如,较新的AMD显卡如Radeon VII、RDNA2架构的可能支持较好,而旧的可能不支持。 接下来,安装ROCm替代CUDA。用户需要安装ROCm版本的PyTorch,这可能需要从源代码编译或者使用预编译的版本。例如,PyTorch官网可能提供针对ROCm的安装指令,如使用pip安装时指定版本。 然后,配置so-vits-svc的环境。用户可能需要修改项目的依赖项,将CUDA相关的依赖替换为ROCm兼容的版本。如果项目中有硬编码的CUDA调用,可能需要调整代码,使用HIP(ROCm的并行计算接口)或其他兼容层。 性能优化方面,ROCm可能不如CUDA成熟,尤其是在某些操作上。用户可能需要调整批量大小、使用混合精度训练,或者启用ROCm的特定优化选项。此外,内存管理也可能不同,需要监控显存使用情况,避免溢出。 如果遇到兼容性问题,可能需要查阅so-vits-svc的社区或Issues,看看是否有其他AMD用户的经验分享。或者考虑使用CPU模式,尽管这会显著降低速度。另外,Docker容器可能已经配置好了ROCm环境,可以尝试使用官方或社区维护的Docker镜像。 最后,用户可能需要测试不同版本的ROCm和PyTorch,找到最稳定的组合。例如,PyTorch 1.8以上对ROCm的支持更好,但具体版本需要匹配显卡驱动。 总结步骤应该是:检查硬件兼容性→安装ROCm和对应PyTorch→修改项目配置→性能调优→寻求社区帮助或替代方案。</think>### 如何在AMD显卡上运行So-VITS-SVC? #### 1. **AMD显卡的兼容性现状** 目前So-VITS-SVC主要依赖PyTorch框架,而PyTorch对AMD显卡的支持需要通过ROCm(Radeon Open Compute)平台实现,而非NVIDIA的CUDA。需确认以下条件: - **显卡型号支持**:仅部分AMD显卡支持ROCm,例如Radeon VII、RDNA2架构显卡(如RX 6000系列)[^1]。 - **系统要求**:需Linux系统(如Ubuntu 20.04+),Windows下需通过WSL2或虚拟机间接支持。 #### 2. **安装ROCm环境** 步骤如下: ```bash # 安装ROCm驱动 sudo apt update sudo apt install rocm-hip-sdk rocminfo # 验证安装 rocminfo ``` #### 3. **配置PyTorch与依赖库** 安装ROCm版本的PyTorch: ```bash pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/rocm5.4.2 ``` 若项目中依赖CUDA代码,需修改为HIP(ROCm的兼容层)或使用替代库。 #### 4. **修改So-VITS-SVC代码** - **替换CUDA调用**:将代码中的`cuda:0`改为`hip:0`。 - **依赖库调整**:部分功能(如特定音频处理库)可能需要重新编译或禁用。 #### 5. **性能优化方法** - **混合精度训练**:启用FP16模式减少显存占用。 ```python scaler = torch.cala.amp.GradScaler() with torch.amp.autocast(device_type='hip'): # 前向计算代码 ``` - **批量大小调整**:AMD显卡显存较小,需降低`batch_size`。 - **启用ROCm优化**:设置环境变量`HSA_OVERRIDE_GFX_VERSION=10.3.0`(根据显卡架构调整)。 #### 6. **替代方案** - **CPU模式运行**:通过`device='cpu'`强制使用CPU,但速度显著下降。 - **Docker容器**:使用预配置ROCm的Docker镜像(如`rocm/pytorch`)简化环境部署。 #### 7. **已知问题与解决** - **显存不足**:尝试启用梯度检查点(Gradient Checkpointing)。 - **内核崩溃**:更新ROCm驱动至最新版本,或回退PyTorch版本。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值