【语音增强论文解读05】FULLY CONVOLUTIONAL RECURRENT NETWORKS FOR SPEECH ENHANCEMENT

作者:Maximilian Strake Bruno Defraene Kristoff Fluyt Wouter Tirry Tim Fingscheidt

1. 动机

        在CRN中通过在卷积编码器和解码器之间集成了LSTM,在这样的结构中,对于完全连接的LSTM,必须放弃特征映射中内部表示的组织和对卷积映射的局部结构的关注。由于LSTM输入的特征空间维度,CRN可能会受到限制。

2. 方法

        使用卷积的LSTM代替CRN中完全连接的LSTM,由此产生的网络称为FCRN,并且卷积的LSTM保留了输入特征映射的结构化组织,可以在内部表示语音的谐波,并且使用较少的可训练参数来处理高维特征。使用权重共享较少参数量。

3. CED结构

        如图特征表示的大小在每一层之前和之后给出,feature axis size×time axis size×number of feature maps, 其中time axis size大小始终设置为 1,使网络能够处理单帧数据。feature axis size和输入number of feature maps分别由 M 和 C 决定。feature axis上的步长为2,

4. 卷积LSTM

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值