声音整合编排 Voicemeeter + RVC

最新推荐文章于 2025-04-24 10:03:28 发布

lhy441

最新推荐文章于 2025-04-24 10:03:28 发布

阅读量1.6k

点赞数 9

文章标签：开源

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lhy441/article/details/144929659

版权

一、前言

前一阵子在娱乐的时候，发现某些人的麦克风语音明显不对，是经过处理包装的，然后我突发奇想，想自己尝试一下能否做出来，然后我上搜索平台进行了检索，进行了一些尝试，搜索发现现在大多是经过加工过的，UI漂亮或是带AI语音包的，定期付费版，其实这些东西都是开源的，现在我将自己的实践记录一下。

二、工具介绍

用到的工具分为两个 1、Voicemeeter 2、RVC

1、Voicemeeter

是一个强大的音频工具，可以将多声道接受整合输出。分为三个版本，可以根据自己的需求去下载。

我以土豆版为例：

软件分为三个大区域，左侧是5条声音输入，中间是3个调音区，右侧物理声卡和虚拟声卡输出

输入和输出我分别选择自己耳机+麦克风的MME模式，有人说WDM性能较好，有人说MME兼容性更好。

A是控制自己能否听到，类似于监听；B是控制别人能否听到，类似于输出；

1）输入区域目前使用1条，上图中我把INPUT 1中的A1和B1都关闭了，此效果是耳机中无法听到自己本来的声音。INPUT 2-5暂时未用到先空着。

2）合成区域分为VAIO、AUX、VAIO3 三部分：

VAIO用于播放本地声音，A1需要开启否则自己听不到本地声音，B1不需要开启，开启后效果是YY语音中的他人可以听到你的本机声音，造成一种重复声音的效果；

AUX 用于变声器RVC的声音输入，A1是监听变声器输出的声音，当确认无问题后可以关闭，B1需要开启，是给别人听的，关闭后别人就听不到声音了；

VAIO3用于一种比较特殊的情况，好比YY连麦的时候你不希望他人的声音通过全频道出去，只自己听到。

3）输出区域，当有声音输出时，对于的物理声卡和虚拟声卡区域会有条线跳动。

2、RVC

是一个开源的声音编排工具，WebUI功能比较强大，可以训练模型，我只使用到realtime实时的。

我是N卡下载对应的显卡的程序，程序运行选择go-realtime-gui的批注里文件双击运行，会打开一个cmd窗口，采集一些系统信息后会弹出UI界面。

调节好参数后，点击开始音频转换，可以看到cmd屏里持续输出文字即成功了。

调节参数解释如下图：

最后是使用程序的输入和输出选择，输出选自己的耳机，输入选Voicemeeter AUX 对应RVC的通道。

三、总结和问题

可以实现声音的变换，测试了YY语音和腾讯会议可以明显的改变输出声音。

遇到问题娱乐中虽然高于官方介绍的配置，但是无论是选择CPU算法还是GPU算法，都会导致FPS降低到80或更低，会形成卡娱乐界面卡顿和声音吞音。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。