麦克风阵列处理之TF-GSC 广义旁瓣相消器

bellshape

已于 2024-03-13 14:15:39 修改

阅读量1.3w

点赞数 4

分类专栏：语音降噪文章标签：麦克风阵列语音增强语音降噪

于 2017-03-23 18:22:59 首次发布

本文链接：https://blog.csdn.net/bellshape/article/details/65447099

版权

语音降噪专栏收录该内容

5 篇文章 7 订阅

订阅专栏

概述

GSC（Generalized Sidelobe Canceller，广义旁瓣相消器）是麦克风阵列处理中实现语音增强的一种方法。本文主要关注arbitrary ATF（Acoustical Transfer Function）模型下基于频域的TF-GSC（Transfer Function Generalized Sidelobe Canceller）的原理。
　　符号表示：对语音信号做短时傅里叶变换，用 $k$ 表示各频点， $l$ 表示帧编号， $S (k, l)$ 表示desired signal， $\textbf{Z}(k,l)=(Z_{1}(k,l),...,Z_{M}(k,l))^{T}$ 表示M个麦克风的观测信号， $\textbf{A}(k)=(A_{1}(k),...,A_{M}(k))^{T}$ 表示声源到各麦克风的ATF。 $\textbf{W}(k,l)=(W_{1}(k,l),...,W_{M}(k,l))^{T}$ 表示滤波器的系数。 $Y (k, l)$ 表示TF-GSC的输出。

原理

优化问题

TF-GSC的目标是求解如下优化问题：

$\min\limits_{\textbf{W}}\{ \textbf{W}^{H}(k,l)\phi_{\textbf{ZZ}}\textbf{W}(k,l)\}$ $s.t. \textbf{W}^{H}(k,l)\textbf{A}(k)=1.$ 其中$\phi_{\textbf{ZZ}}$是$\textbf{Z}(k,l)$的PSD matrix。由于$Y(k,l)=\textbf{W}^{H}(k,l)\textbf{Z}(k,l)$，因此minimize的对象是$E\{Y(k,l)Y^{*}(k,l)\}$，而约束条件则保证了输出等于$S(k,l)$，因此TF-GSC的目标是求得$\textbf{W}$使得保证完美dereverberation的同时实现最大程度的noise reduction。

TF-GSC结构

图1 　　如图1所示，TF-GSC由三部分组成：fixed beamformer（$\textbf{W}_{0}$）、blocking matrix（$\textbf{H}$）、multichannel ANC（$\textbf{G}$）。其中$\textbf{W}_{0}(k,l)=\textbf{A}(k)/||\textbf{A}(k)||^{2}$是上述约束等式的最小范数解，而BM的列张成$\textbf{A}(k)$的零空间，因此总滤波器系数$\textbf{W}(k,l)=\textbf{W}_{0}(k,l)-\textbf{H}(k,l)\textbf{G}(k,l)$总能满足上述约束条件。因此constrained最小化问题可以转化为如下unconstrained最小化问题： $\min\limits_{\textbf{G}}\{[ \textbf{W}_{0}(k,l)-\textbf{H}(k,l)\textbf{G}(k,l)]^{H}\phi_{\textbf{N}_{S}\textbf{N}_{S}}(k,l)[ \textbf{W}_{0}(k,l)-\textbf{H}(k,l)\textbf{G}(k,l)]\}$ 这个unconstrained最优化问题可以用LMS求解。可以看出，fixed beamformer主要实现dereverberation，blocking matrix输出纯噪声，用于产生noise reference signals，multichannel ANC实现自适应降噪。

ATF估计

求解fixed beamformer和blocking matrix需要已知ATF。在实际室内环境下，RIR（Room Impulse Response）非常长，难以估计。RTF（Relative Transfer Function） $\tilde{\textbf{A}}(k)=\textbf{A}(k)/A_{1}(k)$ 表示麦克风之间的传输函数，其对应的impulse response能量衰减比ATF快得多，更容易准确估计。[1]介绍了两种估计RTF的方法，思想是求某个等式的least square解，具体方法不再赘述。
　　需要注意的是fixed beamformer变为： $\textbf{W}_{0}(k,l)=\tilde{\textbf{A}}(k)/||\tilde{\textbf{A}}(k)||^{2}$ 。这种情况下算法无法实现dereverberation，因为约束条件只能保证恢复 $A_{1}(k)S(k,l)$ 。

Matlab验证

仿真环境：室内环境（RIR由Image method产生）、一位说话人，一个point source noise。6个均匀排布的线阵麦克风，间距为6cm。对比某个麦克风的observed signal与TF-GSC的输出如图2所示。

图2

Q&A

为什么TF-GSC之后通常要加postfiltering进一步降噪？
　　TF-GSC只能消除coherent noise（ANC的局限），实际noise field包括coherent noise、diffused noise、incoherent noise以及nonstationary noise。TF-GSC的ANC部分只能消除coherent noise和diffused noise的低频部分，在其他情况下，TF-GSC的ANC部分没起作用，降噪主要靠fixed beamformer，性能十分有限。加入postfiltering可以提高其他情况下的降噪性能。

Reference

主要参照[1]和[2]两本书，图1来自[1]。

[1]: Gannot S, Cohen I. Adaptive Beamforming and Postfiltering[M]. Springer Berlin Heidelberg, 2008.
[2]: Benesty J, Chen J, Huang Y. Microphone Array Signal Processing[M]. Springer Berlin Heidelberg, 2008.

bellshape

关注

4
点赞
踩
42

收藏

觉得还不错? 一键收藏
46
评论
麦克风阵列处理之TF-GSC 广义旁瓣相消器

GSC（Generalized Sidelobe Canceller，广义旁瓣相消器）是麦克风阵列处理中实现语音增强的一种方法。本文主要关注arbitrary ATF（Acoustical Transfer Function）模型下基于频域的TF-GSC（Transfer Function Generalized Sidelobe Canceller）的原理。
复制链接

扫一扫