概述
GSC(Generalized Sidelobe Canceller,广义旁瓣相消器)是麦克风阵列处理中实现语音增强的一种方法。本文主要关注arbitrary ATF(Acoustical Transfer Function)模型下基于频域的TF-GSC(Transfer Function Generalized Sidelobe Canceller)的原理。
符号表示:对语音信号做短时傅里叶变换,用
k
k
k 表示各频点,
l
l
l 表示帧编号,
S
(
k
,
l
)
S(k,l)
S(k,l)表示desired signal,
Z
(
k
,
l
)
=
(
Z
1
(
k
,
l
)
,
.
.
.
,
Z
M
(
k
,
l
)
)
T
\textbf{Z}(k,l)=(Z_{1}(k,l),...,Z_{M}(k,l))^{T}
Z(k,l)=(Z1(k,l),...,ZM(k,l))T表示M个麦克风的观测信号,
A
(
k
)
=
(
A
1
(
k
)
,
.
.
.
,
A
M
(
k
)
)
T
\textbf{A}(k)=(A_{1}(k),...,A_{M}(k))^{T}
A(k)=(A1(k),...,AM(k))T表示声源到各麦克风的ATF。
W
(
k
,
l
)
=
(
W
1
(
k
,
l
)
,
.
.
.
,
W
M
(
k
,
l
)
)
T
\textbf{W}(k,l)=(W_{1}(k,l),...,W_{M}(k,l))^{T}
W(k,l)=(W1(k,l),...,WM(k,l))T表示滤波器的系数。
Y
(
k
,
l
)
Y(k,l)
Y(k,l)表示TF-GSC的输出。
原理
优化问题
TF-GSC的目标是求解如下优化问题:
TF-GSC结构
ATF估计
求解fixed beamformer和blocking matrix需要已知ATF。在实际室内环境下,RIR(Room Impulse Response)非常长,难以估计。RTF(Relative Transfer Function)
A
~
(
k
)
=
A
(
k
)
/
A
1
(
k
)
\tilde{\textbf{A}}(k)=\textbf{A}(k)/A_{1}(k)
A~(k)=A(k)/A1(k)表示麦克风之间的传输函数,其对应的impulse response能量衰减比ATF快得多,更容易准确估计。[1]介绍了两种估计RTF的方法,思想是求某个等式的least square解,具体方法不再赘述。
需要注意的是fixed beamformer变为:
W
0
(
k
,
l
)
=
A
~
(
k
)
/
∣
∣
A
~
(
k
)
∣
∣
2
\textbf{W}_{0}(k,l)=\tilde{\textbf{A}}(k)/||\tilde{\textbf{A}}(k)||^{2}
W0(k,l)=A~(k)/∣∣A~(k)∣∣2。这种情况下算法无法实现dereverberation,因为约束条件只能保证恢复
A
1
(
k
)
S
(
k
,
l
)
A_{1}(k)S(k,l)
A1(k)S(k,l)。
Matlab验证
仿真环境:室内环境(RIR由Image method产生)、一位说话人,一个point source noise。6个均匀排布的线阵麦克风,间距为6cm。对比某个麦克风的observed signal与TF-GSC的输出如图2所示。
Q&A
- 为什么TF-GSC之后通常要加postfiltering进一步降噪?
TF-GSC只能消除coherent noise(ANC的局限),实际noise field包括coherent noise、diffused noise、incoherent noise以及nonstationary noise。TF-GSC的ANC部分只能消除coherent noise和diffused noise的低频部分,在其他情况下,TF-GSC的ANC部分没起作用,降噪主要靠fixed beamformer,性能十分有限。加入postfiltering可以提高其他情况下的降噪性能。
Reference
主要参照[1]和[2]两本书,图1来自[1]。
[1]: Gannot S, Cohen I. Adaptive Beamforming and Postfiltering[M]. Springer Berlin Heidelberg, 2008.
[2]: Benesty J, Chen J, Huang Y. Microphone Array Signal Processing[M]. Springer Berlin Heidelberg, 2008.