针对rnnoise vad 分享

最新推荐文章于 2025-04-02 19:59:32 发布

zeark

最新推荐文章于 2025-04-02 19:59:32 发布

阅读量1.7k

点赞数 1

分类专栏：降噪语音增强文章标签： vad rnnoise

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012514944/article/details/89353125

版权

降噪同时被 2 个专栏收录

13 篇文章

订阅专栏

13 篇文章

订阅专栏

1、首先，提取特征点，通过简单的能量的方式来计算vad，这是很有效的方式，因为语音源就已经确保都是非常干净的语音。从测试的结果来看，准确率也还可以，但是并没有想象的那么高，而且很明显存在滞后以及尾音超前，所以就决定了vad 的效果不会很好。

2、在训练模型时，正因为vad 的效果不会太好，所以设计的训练单元也就不是很多，对于vad 的输出，特别是低信噪比的输出结果就很不理想，在训练过程，针对vad 的权重也设置的非常的低，这是非常合理的。

3、通过修改vad 以及权重，对整个训练的影响非常的大，比如修改提取特征点时,计算vad 的方法，使得vad 更准确，训练后效果失真更小，但是通过训练过程的曲线来看，vad 的输出结果就会更不准确,噪声残留增加。vad 不同的权重，导致降噪残留以及失真也是不一样的，在训练测试过程，有条件自己修改测试的情况下，可以自己测试效果。

4、总结来说，vad 影响效果，特别是，当修改vad 计算方式以及权重，使得训练过程vad 的准确率更高时，往往会影响影响使摩擦音的语音损伤加重。

欢迎大家加音频算法分享讨论群：153268894 （作者 zeark）。

博客等级

码龄12年

28
原创

25
点赞

183
收藏

113
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

深度学习抑制啸叫
inprogram: 你用的是transformer吗？
rnnoise 运行报错解决
大头儿: ValueError: Unknown initializer: initializer 您好，这个怎么解决呀
rnnoise 训练步骤
神无袖: 层主我看了你帖子的评论，也是有差不多的问题，用au看了原作者的噪声库发现噪声幅值差距很大，然后他的c文件输入没有标准化，语料也是-10~20dB随机混合，VAD也是能量VAD,给人感觉准确率很低，训练后的VAD loss就比降噪loss大很多并且下不来，推断的时候语音尾段有噪声残留，有babble的时候效果更差。我试过把VAD权重调大但是loss就下不来，调的小静端降噪效果会变差，不知道你之前重新给vad打标签能不能改善，还是说直接把混合噪声的幅值调小一点？还有我用了差不多8M帧数据这个数据量是不是有点少了
rnnoise 训练步骤
RoadmanG: 他这个是把训练音频合成两个文件，我觉得这样很麻烦，我改成在文件夹里面找数据的形式了，具体的看我别的博文，里面有github
rnnoise 训练步骤
神无袖: 你好请问chopper.c和noise_chooper.c文件是哪来的？源码里好像没有。作者好像也不提供数据了。如果是自己实现的话signal.raw和noise.raw是把数据拼成一行吗？是做成什么类型的文件呢

最新文章

目录

展开全部

收起

评论 14

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。