uvr5的下载使用和一些常用模型(个人使用于so-vits-svc)

本文介绍了GitHub上的Anjok07开发的人声去除器GUI,包括如何下载预训练模型(如UVR5),以及如何通过EnsembleMode和VRArchitecture进行人声分离和混响降噪。重点提及了MDX-Net模型及其在音频处理中的应用。
摘要由CSDN通过智能技术生成

uvr5下载:

GitHub - Anjok07/ultimatevocalremovergui:使用深度神经网络的人声去除器的 GUI.icon-default.png?t=N7T8https://github.com/Anjok07/ultimatevocalremovergui

beta版下载地址icon-default.png?t=N7T8https://github.com/TRvlvr/model_repo/releases/download/uvr_update_patches/UVR_Patch_3_29_24_5_11_BETA_full_roformer.exe

b90b484c8b8e41aa9acbd1ec0860019b.png

uvr5模型下载:

新下载的uvr5仅仅自带了很少的模型,大部分模型需要自己下载。(点开小扳手)

(点download center)

接下来分为两种情况。

1,有VPN(可以直接在uvr内下载)选好自己需要的模型,点击下载,下好的模型会自动放入对应的文件夹。

2,没有VPN(点击小钥匙下面的按钮)

选择自己要下的模型,已经有的模型不会显示,大家选自己需要的就行,我是随便选的。

选择后点击open link to model 就会自动跳转到下载连接。(如果电脑下载不了的话大家可以试试用手机下,真的很神奇,有时候电脑下不了的手机就可以)

下载好后点击open model directory 将下载好的模型放进去就好了

处理方式:

  1. Ensemble Mode:合奏模式
  2. VR Architecture:个人用于分离和声与混响
  3. MDX-Net:个人用于分离人声与伴奏
  4. Demucs:没用过

(1)VR Architecture:

2个参数:

Windews Size:越小,效果就越好,占用的资源越大。常用有3种“1024低精换”,“512平均”,“320较好”。

Aggression Setting (力度设置):设置去除声音的力度,默认10,数值超过10可能导致非人声模型的乐器声变得浑浊。

常用模型:

4_HP:分离人声与伴奏

5_HP-Karokee-UVR.pth:将人声和其他声音分离(激进)

6_HP-Karaoke-UVR.pth:  将人声和其他声音分离(温和)

UVR-DeEcho-DeReverb:去混响降噪(激进)

UVR-De-Echo-Aggressive:去混响降噪(平均)

UVR-De-Echo-Normal:去混响降噪(温和)

UVR-DeNoice:去混响杂音

还要提一嘴,这个算法在分离人声时有可能会把ASMR中的人声当成背景音

(2)MDX-Net:

具有5种模式的模型,这些模型使用混合频谱/波形进行源分离(处理高音质音频的AI算法,对人声的识别提取能力强大,就是慢一些)

常用模型:均为可以分离人声与伴奏的模型

MDX23C-InstVoc HQ :分离人声与伴奏,很强但处理时间长(大概是现存最强的模型)

BS-Roformer-Viperx-1296:2024年3月末更新,需要beta版安装(可以代替MDX23C)与它同时更新的还有2个微调版本,可以自行下载体验。

UVR_MDXNET_1.onnx:在SDR上得分9.703

UVR_MDXNET_2.onnx:在SDR上得分9.682

UVR_MDXNET_3.onnx:在SDR上得分9.662,

UVR_MDXNET_main.onnx:据说很强

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值