一. 基于神经网络的波束形成方法
目前在波束形成中引入深度学习的方式,主要有3类:
1. 掩码估计与传统方法的结合(频域)
主要应用神经网络处理传统算法不太容易建模的噪声估计部分。 比如用NN估计语音和噪音各自的掩码,再用该掩码使用传统方法估计噪音的功率谱,后在此基础上使用MVDR或GSC等传统波束形成算法对噪声进行抑制。
优点:对现有系统改动较小,使用比较灵活。
2. 频域预测波束形成权重(频域)
即不保留传统波束形成模块,而通过神经网络直接预测波束形成的权重(复数)。NN预测的权重和多通道的复数频谱相乘后求和得到频域的波束形成结果,在ISTFT得到时域波形。
特点:方法与传统波形形成方法类似,只是求权重采用NN。
3. 时域预测波形形成滤波器系数(时域)
比如FastNet算法,不采用STFT,通过TCN直接提取信号特征,网络输出时域FIR滤波器系数,再和输入语音进行卷积滤波在求和得到最终输出。