【语音增强论文解读04】DCCRN+: Channel-wise Subband DCCRN with SNR Estimation for SpeechEnhancement

作者:Shubo Lv, Yanxin Hu, Shimin Zhang, Lei Xie

文末附文章地址和开源代码地址

1.动机

        对DCCRN做了进一步的更新(有不了解DCCRN的小伙伴可以看我先前的文展)。

2.方法

        1.将模型扩展到子带处理。

        2.用TF-LSTM代替LSTM。

        3.使用卷积块聚合编码器的输出,然后再送到解码器。

        4.为解码器制定一个先验SNR估计模块,再去除噪声的同时保持良好的语音质量。

        5.最后采用post-processing模块进一步抑制不自然的残余噪声。

3.网络架构

        DCCRN+的整体网络架构如下图所示:

        总体结构与DCCRN类似,但有以下区别:

        1.在编码器/解码器之前/之后使用拆分/合并模块进行子带处理。

        2) 用于频率和时间尺度时间建模的复杂 TF-LSTM。

        3)在馈送到解码器之前,添加Convolution Pathway以更好地聚合来自编码器输出的信息。

        4)增加SNR估计模块,以减轻噪声抑制过程中的语音失真。

        5)Post-processing以进一步去除残余噪声。

3.1 TF-LSTM模块

        TF-LSTM模块设计如下图:

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值