rnnoise 两篇

深度学习降噪方案-RNNoise源码解析 - 特征提取

https://blog.csdn.net/danteLiujie/article/details/102799038?utm_medium=distribute.wap_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.wap_blog_relevant_pic&depth_1-utm_source=distribute.wap_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.wap_blog_relevant_pic

https://blog.csdn.net/u012514944/article/details/85338678?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control

rnnoise  总共提取了42个输入特征点:
a、针对输⼊入信号bark 22个频带的能量量做dct变换,得到22个BFCC系数。

b、针对22个中的前六个即1.2k 做导数处理,针对 当前及过去三帧处理理为(增加12个特征点):
6个:An+A(n-1)+A(n-2);
+6个:An -A(n-2);
+6个:An +A(n-2)-2A(n-1)。

c、针对基⾳周期相关性,做dct变换,得到前6组带的系数以及一个基⾳周期的 系数(增加一个特征点)。
d、通过计算过去8帧频带的差异值之和,求得稳定性系数1个(一个特征点)。

特征点的提取主要是考虑:

1、采样BFCC系数,是因为BFCC在降噪方面的效果比MFCC更好。

2、基音周期系数,主要因为噪声会导致基因周期变低,人声中浊音具有明显的周期性,噪声不具有。

rnnoise 具体训练、应用,测试,技术优化,欢迎大家加音频算法讨论群:153268894 (作者 zeark)。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值