rnnoise 48k采样率转16k采样率有没有必要？

最新推荐文章于 2024-09-13 22:10:01 发布

zeark

最新推荐文章于 2024-09-13 22:10:01 发布

阅读量3.7k

点赞数

分类专栏：降噪语音增强文章标签： rnnoise 深度学习降噪 webrtc 音视频

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012514944/article/details/86085381

版权

降噪同时被 2 个专栏收录

13 篇文章 7 订阅

订阅专栏

13 篇文章 11 订阅

订阅专栏

1、关于rnnoise ，因为语音增强大部分场景都是16k，所以很多人的就会想要16k 的模型，而作者提供的是48k的模型，

那到底有没有必要从新训练成16k 的呢？

优点：

a、我们先来分析一下代码结构，从48k 降低到16k，fft 可以从960 降低到320，其他代码基本不会有效率上的减少。

b、可以减少一次上采样到48k以及一次下采样16k。

缺点：

a、pitch 滤波提高基音谐波造成的噪声抑制减弱能力降低，fft后的分辨率下降，导致算法的效果降低。

结论：如果对效率不是那么追求的应用，最好还是使用48k来处理！

rnnoise 具体训练、应用，测试，技术优化，欢迎大家加音频算法讨论群：153268894 （作者 zeark）。

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zeark CSDN认证博客专家 CSDN认证企业博客

码龄11年

28: 原创

7万+: 周排名

106万+: 总排名

10万+: 访问

: 等级

1333: 积分

111: 粉丝

25: 获赞

59: 评论

179: 收藏

私信

关注

热门文章

分类专栏

最新评论

深度学习抑制啸叫
inprogram: 你用的是transformer吗？
rnnoise 运行报错解决
大头儿: ValueError: Unknown initializer: initializer 您好，这个怎么解决呀
rnnoise 训练步骤
神无袖: 层主我看了你帖子的评论，也是有差不多的问题，用au看了原作者的噪声库发现噪声幅值差距很大，然后他的c文件输入没有标准化，语料也是-10~20dB随机混合，VAD也是能量VAD,给人感觉准确率很低，训练后的VAD loss就比降噪loss大很多并且下不来，推断的时候语音尾段有噪声残留，有babble的时候效果更差。我试过把VAD权重调大但是loss就下不来，调的小静端降噪效果会变差，不知道你之前重新给vad打标签能不能改善，还是说直接把混合噪声的幅值调小一点？还有我用了差不多8M帧数据这个数据量是不是有点少了
rnnoise 训练步骤
RoadmanG: 他这个是把训练音频合成两个文件，我觉得这样很麻烦，我改成在文件夹里面找数据的形式了，具体的看我别的博文，里面有github
rnnoise 训练步骤
神无袖: 你好请问chopper.c和noise_chooper.c文件是哪来的？源码里好像没有。作者好像也不提供数据了。如果是自己实现的话signal.raw和noise.raw是把数据拼成一行吗？是做成什么类型的文件呢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。