一、前言
前一阵子在娱乐的时候,发现某些人的麦克风语音明显不对,是经过处理包装的,然后我突发奇想,想自己尝试一下能否做出来,然后我上搜索平台进行了检索,进行了一些尝试,搜索发现现在大多是经过加工过的,UI漂亮或是带AI语音包的,定期付费版,其实这些东西都是开源的,现在我将自己的实践记录一下。
二、工具介绍
用到的工具分为两个 1、Voicemeeter 2、RVC
1、Voicemeeter
是一个强大的音频工具,可以将多声道接受整合输出。分为三个版本,可以根据自己的需求去下载。
我以土豆版为例:
软件分为三个大区域,左侧是5条声音输入,中间是3个调音区,右侧物理声卡和虚拟声卡输出
输入和输出我分别选择自己耳机+麦克风的MME模式,有人说WDM性能较好,有人说MME兼容性更好。
A是控制自己能否听到,类似于监听;B是控制别人能否听到,类似于输出;
1)输入区域目前使用1条,上图中我把INPUT 1中的A1和B1都关闭了,此效果是耳机中无法听到自己本来的声音。INPUT 2-5暂时未用到先空着。
2)合成区域分为VAIO、AUX、VAIO3 三部分:
VAIO用于播放本地声音,A1需要开启否则自己听不到本地声音,B1不需要开启,开启后效果是YY语音中的他人可以听到你的本机声音,造成一种重复声音的效果;
AUX 用于变声器RVC的声音输入,A1是监听变声器输出的声音,当确认无问题后可以关闭,B1需要开启,是给别人听的,关闭后别人就听不到声音了;
VAIO3用于一种比较特殊的情况,好比YY连麦的时候你不希望他人的声音通过全频道出去,只自己听到。
3)输出区域,当有声音输出时,对于的物理声卡和虚拟声卡区域会有条线跳动。
2、RVC
是一个开源的声音编排工具,WebUI功能比较强大,可以训练模型,我只使用到realtime实时的。
我是N卡下载对应的显卡的程序,程序运行选择go-realtime-gui的批注里文件双击运行,会打开一个cmd窗口,采集一些系统信息后会弹出UI界面。
调节好参数后,点击开始音频转换,可以看到cmd屏里持续输出文字即成功了。
调节参数解释如下图:
最后是使用程序的输入和输出选择,输出选自己的耳机,输入选Voicemeeter AUX 对应RVC的通道。
三、总结和问题
可以实现声音的变换,测试了YY语音和腾讯会议可以明显的改变输出声音。
遇到问题娱乐中虽然高于官方介绍的配置,但是无论是选择CPU算法还是GPU算法,都会导致FPS降低到80或更低,会形成卡娱乐界面卡顿和声音吞音。