麦克风阵列概述与波束形成—(6)基于神经网络的波束形成

最新推荐文章于 2024-03-13 16:44:38 发布

咕噜咕噜day

最新推荐文章于 2024-03-13 16:44:38 发布

阅读量1.3k

点赞数 1

分类专栏：语音识别服务实战阅读总结文章标签：人工智能深度学习波束形成麦克风阵列

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36533552/article/details/125381075

版权

一. 基于神经网络的波束形成方法

目前在波束形成中引入深度学习的方式，主要有3类：

1. 掩码估计与传统方法的结合（频域）

主要应用神经网络处理传统算法不太容易建模的噪声估计部分。比如用NN估计语音和噪音各自的掩码，再用该掩码使用传统方法估计噪音的功率谱，后在此基础上使用MVDR或GSC等传统波束形成算法对噪声进行抑制。

优点：对现有系统改动较小，使用比较灵活。

2. 频域预测波束形成权重（频域）

即不保留传统波束形成模块，而通过神经网络直接预测波束形成的权重（复数）。NN预测的权重和多通道的复数频谱相乘后求和得到频域的波束形成结果，在ISTFT得到时域波形。

特点：方法与传统波形形成方法类似，只是求权重采用NN。

3. 时域预测波形形成滤波器系数（时域）

比如FastNet算法，不采用STFT，通过TCN直接提取信号特征，网络输出时域FIR滤波器系数，再和输入语音进行卷积滤波在求和得到最终输出。

最低0.47元/天解锁文章

咕噜咕噜day

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
麦克风阵列概述与波束形成—(6)基于神经网络的波束形成

基于神经网络的波束形成
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。