【AI 伴奏提取软件】AMD 显卡使用 UVR5 教程

MicroLindb

已于 2025-01-19 03:05:56 修改

阅读量3k

点赞数 29

分类专栏： AI_stableDiffusion 文章标签：人工智能 AI AI工具消除伴奏人声

于 2025-01-19 03:04:23 首次发布

本文链接：https://blog.csdn.net/qq_43768851/article/details/145235734

版权

AI_stableDiffusion 专栏收录该内容

9 篇文章

订阅专栏

一、版本选择

1.UVR5 显卡问题

原本，只有 NVIDIA 显卡能够使用 UVR5，但是，现在 INTEL 和 AMD 的显卡也能够使用 UVR5 了。
但是别着急，听我说：
我们要选择合适的版本，Beta版本才能够使用。
最新的是 UVR5 的 5.6 版本，但是需要 5.6 UVR Beta Roformer 版本才行。

2.UVR Beta Roformer下载

下载URL：https://github.com/Anjok07/ultimatevocalremovergui/releases/tag/v5.6

来自官方的说明：

在这里插入图片描述

windows 用户选择这个下载。
当然，如果你是 MAC 用户，选择 .dmg 版本即可。

在这里插入图片描述

二、安装

1.创建一个安装需要使用到的目录

在这里插入图片描述

2.安装

下载好的文件

在这里插入图片描述
安装，以管理员身份运行。可能会弹窗报警，但是选择仍要运行。

在这里插入图片描述

3.启动

请注意，第一次启动可能会崩溃，无响应，请重新多启动几次。
请注意，第一次启动可能会崩溃，无响应，请重新多启动几次。
请注意，第一次启动可能会崩溃，无响应，请重新多启动几次。

另外，第一次启动巨慢，大概需要花费 3mins 的时间，期间无任何响应
另外，第一次启动巨慢，大概需要花费 3mins 的时间，期间无任何响应
另外，第一次启动巨慢，大概需要花费 3mins 的时间，期间无任何响应

此数据基于 CPU amd 7950X

在这里插入图片描述

4.界面介绍

勾选此选项，启动 GPU 加速。

在这里插入图片描述
我们依次介绍各项功能，我将它分为 4 个区域来介绍。

区域1：
选择输入和输出的文件、目录；
选择你想要输出的文件的格式。

转换器URL：https://magic-akari.github.io/ncmc-web/
这个转换器能够把wyy的.ncm格式的文件转换为 mp3 格式。

在这里插入图片描述

选择输入的文件：

在这里插入图片描述

点击确认输入：

在这里插入图片描述

关闭窗口：

在这里插入图片描述

可以看到，已经选择好输入文件了：

在这里插入图片描述

选择输出目录，不用我说了吧？

在这里插入图片描述

区域2：
CHOOSE PROCESS METHOD：
选择音频处理的方法。此处显示为 MDX-Net，它是 UVR5 提供的一种基于深度学习的音频分离模型，用于提取人声或伴奏。
SEGMENT SIZE：
采样率，一般来说，选择 448 就好，高清采样 480（但一般没必要）。
OVERLAP：
设置处理时的重叠量，影响每个片段之间的重叠大小。此处默认是 Default。

在这里插入图片描述

区域3：
Choose MDX-Net Model
功能：选择您要使用的 MDX-Net 模型。MDX-Net 是用于音频分离的深度学习模型，您可以选择不同的模型来执行人声与伴奏的分离。这里的 Choose Model 会列出可供选择的所有模型，您可以根据需要选择。
GPU Conversion
功能：勾选此选项表示使用 GPU 加速进行音频处理，这通常会显著加快处理速度。如果您的计算机配有支持 CUDA 的 NVIDIA 显卡，勾选该选项将加速处理过程。
Primary Stem Only
功能：如果勾选该选项，UVR5 将只提取音频的主音轨（人声）。它会在分离过程中仅关注人声部分，而忽略伴奏。
Secondary Stem Only
功能：如果勾选该选项，UVR5 将只提取音频中的副音轨（伴奏）。它会在分离过程中仅关注伴奏部分，而忽略人声。

在这里插入图片描述