1. 前言
维纳滤波因其简单与有效性而在语音增强中广泛使用,但是其在降噪的同时也会使得感兴趣的语音信号失真,这也是单通道(单麦克风)语音增强算法的主要缺点,而多通道(多个麦克风)算法则能够有效地解决这一问题。因此这篇文章将依次讲述单通道维纳滤波,多通道维纳滤波以及最小方差无失真响应(MVDR)滤波器并比较它们之间的联系以及效果差异。
2. 单通道维纳滤波
2.1 时域维纳滤波
现考虑一个零均值干净语音信号
x
(
k
)
x(k)
x(k)被零均值噪声
v
(
k
)
v(k)
v(k)所污染(噪声与语音不相关)。则麦克风接收到的含噪语音
y
(
k
)
y(k)
y(k)可表示为
y
(
k
)
=
x
(
k
)
+
v
(
k
)
(
2.1.1
)
y(k)=x(k)+v(k)\quad(2.1.1)
y(k)=x(k)+v(k)(2.1.1)
定义误差信号
e
(
k
)
e(k)
e(k)为
e
(
k
)
=
x
(
k
)
−
z
(
k
)
=
x
(
k
)
−
h
T
y
(
k
)
(
2.1.2
)
\begin{aligned}e(k)&=x(k)-z(k)\\&=x(k)-\mathbf{h}^{T}\mathbf{y}(k)\end{aligned}\quad(2.1.2)
e(k)=x(k)−z(k)=x(k)−hTy(k)(2.1.2)
其中
z
(
k
)
z(k)
z(k)为估计的干净语音,
h
=
[
h
0
h
1
⋯
h
L
−
1
]
T
\mathbf{h}=[h_{0}\quad h_{1}\quad\cdots\quad h_{L-1}]^{T}
h=[h0h1⋯hL−1]T为长度为L的FIR滤波器,
y
(
k
)
=
[
y
(
k
)
y
(
k
−
1
)
⋯
y
(
k
−
L
+
1
)
]
T
\mathbf{y}(k)=[y(k)y(k-1)\cdots y(k-L+1)]^{T}
y(k)=[y(k)y(k−1)⋯y(k−L+1)]T为包含观测信号
y
(
k
)
y(k)
y(k)的L个最新样本的输入向量。
维纳滤波器是在均方误差准则下的最优滤波器,因此其代价函数为
J
(
h
)
=
E
[
e
2
(
k
)
]
=
E
[
x
2
(
k
)
−
2
h
T
y
(
k
)
x
(
k
)
+
h
T
y
(
k
)
y
T
(
k
)
h
]
=
h
T
R
y
y
h
−
2
r
y
x
T
h
+
σ
x
2
(
2.1.3
)
\begin{aligned}J(\mathbf{h})=E[e^{2}(k)]&=E[x^{2}(k)-2\mathbf{h}^{T}\mathbf{y}(k)x(k)+\mathbf{h}^{T}\mathbf{y}(k)\mathbf{y}^{T}(k)\mathbf{h}]\\&=\mathbf{h}^T\mathbf{R}_{yy}\mathbf{h}-2\mathbf{r}_{yx}^T\mathbf{h}+\sigma_x^2\end{aligned}\quad(2.1.3)
J(h)=E[e2(k)]=E[x2(k)−2hTy(k)x(k)+hTy(k)yT(k)h]=hTRyyh−2ryxTh+σx2(2.1.3)
其中
R
y
y
=
E
[
y
(
k
)
y
T
(
k
)
]
\mathbf{R}_{yy}=E[\mathbf{y}(k)\mathbf{y}^{T}(k)]
Ryy=E[y(k)yT(k)]是观测信号的相关矩阵,
r
y
x
=
E
[
y
(
k
)
x
(
k
)
]
\mathbf{r}_{yx}=E[\mathbf{y}(k)x(k)]
ryx=E[y(k)x(k)]是观测信号与干净语音信号的互相关向量,
σ
x
2
=
E
[
x
2
(
k
)
]
\sigma_{x}^{2}=E[x^{2}(k)]
σx2=E[x2(k)]是干净语音信号的方差。
维纳滤波器就是找到一个
h
\mathbf{h}
h使得均方误差
J
(
h
)
J(\mathbf{h})
J(h)最小,用下式表示
h
W
=
arg
min
h
J
(
h
)
(
2.1.4
)
\mathbf{h}_{\mathrm{W}}=\arg\min_{\mathbf{h}}J(\mathbf{h})\quad(2.1.4)
hW=arghminJ(h)(2.1.4)
将
J
(
h
)
J(\mathbf{h})
J(h)对
h
\mathbf{h}
h求导并使导数等于0即可求出维纳滤波器
h
W
\mathbf{h}_{\mathrm{W}}
hW
∂
J
(
h
)
∂
h
=
2
R
y
y
h
−
2
r
y
x
=
0
(
2.1.5
)
\frac{\partial J(\mathbf{h})}{\partial\mathbf{h}}=2\mathbf{R}_{yy}\mathbf{h}-2\mathbf{r}_{yx}=0\quad(2.1.5)
∂h∂J(h)=2Ryyh−2ryx=0(2.1.5)
h
W
=
R
y
y
−
1
r
y
x
(
2.1.6
)
\mathbf{h}_{\mathrm{W}}=\mathbf{R}_{yy}^{-1}\mathbf{r}_{yx}\quad(2.1.6)
hW=Ryy−1ryx(2.1.6)
很明显,含噪语音
y
(
k
)
y(k)
y(k)是可以观测到的,即
R
y
y
\mathbf{R}_{yy}
Ryy是可求解的。但是干净语音信号
x
(
k
)
x(k)
x(k)是不可观测到的,因此
r
y
x
\mathbf{r}_{yx}
ryx无法直接求解。此时需要利用到噪声与干净语音是不相关的这一性质,有
r
y
x
=
E
[
y
(
k
)
x
(
k
)
]
=
E
{
y
(
k
)
[
y
(
k
)
−
v
(
k
)
]
}
=
E
[
y
(
k
)
y
(
k
)
]
−
E
{
[
x
(
k
)
+
v
(
k
)
]
v
(
k
)
}
=
E
[
y
(
k
)
y
(
k
)
]
−
E
[
v
(
k
)
v
(
k
)
]
=
r
y
y
−
r
v
v
(
2.1.7
)
\begin{aligned} \mathbf{r}_{yx}& =E[\mathbf{y}(k)\mathbf{x}(k)] \\ &=E\{\mathbf{y}(k)[y(k)-v(k)]\} \\ &=E[\mathbf{y}(k)y(k)]-E\{[\mathbf{x}(k)+\mathbf{v}(k)]v(k)\} \\ &=E[\mathbf{y}(k)y(k)]-E[\mathbf{v}(k)v(k)] \\ &=\mathbf{r}_{yy}-\mathbf{r}_{vv} \end{aligned}\quad(2.1.7)
ryx=E[y(k)x(k)]=E{y(k)[y(k)−v(k)]}=E[y(k)y(k)]−E{[x(k)+v(k)]v(k)}=E[y(k)y(k)]−E[v(k)v(k)]=ryy−rvv(2.1.7)
因此现在只需要求出
r
y
y
\mathbf{r}_{yy}
ryy和
r
v
v
\mathbf{r}_{vv}
rvv就可以求解
r
y
x
\mathbf{r}_{yx}
ryx。由于
y
(
k
)
y(k)
y(k)是可以观测到的,因此
r
y
y
=
E
[
y
(
k
)
y
(
k
)
]
\mathbf{r}_{yy}=E[\mathbf{y}(k)y(k)]
ryy=E[y(k)y(k)]可以很容易地估计出来,而
r
v
v
=
E
[
v
(
k
)
v
(
k
)
]
\mathbf{r}_{vv}=E[\mathbf{v}(k)v(k)]
rvv=E[v(k)v(k)]则可以在纯噪声时段估计出来。
2.2 频域维纳滤波
这一节将讲述维纳滤波的频域实现,相比于时域实现,它在实践中更好更常用,因为它允许在每个频率上更好地控制降噪与语音失真。
同样考虑一个零均值干净语音信号
x
(
k
)
x(k)
x(k)被零均值噪声
v
(
k
)
v(k)
v(k)所污染(噪声与语音不相关)。则麦克风接收到的含噪语音
y
(
k
)
y(k)
y(k)可表示为
y
(
k
)
=
x
(
k
)
+
v
(
k
)
(
2.2.1
)
y(k)=x(k)+v(k)\quad(2.2.1)
y(k)=x(k)+v(k)(2.2.1)
在频域,式2.2.1可以重写为
Y
(
j
ω
)
=
X
(
j
ω
)
+
V
(
j
ω
)
(
2.2.2
)
Y(j\omega)=X(j\omega)+V(j\omega)\quad(2.2.2)
Y(jω)=X(jω)+V(jω)(2.2.2)
其中
Y
(
j
ω
)
Y(j\omega)
Y(jω),
X
(
j
ω
)
X(j\omega)
X(jω),
V
(
j
ω
)
V(j\omega)
V(jω)分别是
y
(
k
)
y(k)
y(k),
x
(
k
)
x(k)
x(k),
v
(
k
)
v(k)
v(k)的离散时间傅里叶变化(DTFT)。
由于
x
(
k
)
x(k)
x(k)与
v
(
k
)
v(k)
v(k)是不相关的,则
y
(
k
)
y(k)
y(k)的功率谱密度
ϕ
y
y
(
ω
)
\phi_{yy}(\omega)
ϕyy(ω)有
ϕ
y
y
(
ω
)
=
E
[
∣
Y
(
j
ω
)
∣
2
]
=
E
[
∣
X
(
j
ω
)
+
V
(
j
ω
)
∣
2
]
=
E
[
[
X
(
j
ω
)
+
V
(
j
ω
)
]
⋅
[
X
∗
(
j
ω
)
+
V
∗
(
j
ω
)
]
]
=
E
[
∣
X
(
j
ω
)
∣
2
]
+
E
[
∣
V
(
j
ω
)
∣
2
]
=
ϕ
x
x
(
ω
)
+
ϕ
v
v
(
ω
)
(
2.2.3
)
\begin{gathered} \phi_{yy}(\omega)=E[|Y(j\omega)|^{2}]=E[|X(j\omega)+V(j\omega)|^{2}] \\ =E\Big[[X(j\omega)+V(j\omega)]\cdot[X^{*}(j\omega)+V^{*}(j\omega)]\Big] \\ =E[|X(j\omega)|^{2}]+E[|V(j\omega)|^{2}] \\ =\phi_{xx}(\omega)+\phi_{vv}(\omega) \end{gathered}\quad(2.2.3)
ϕyy(ω)=E[∣Y(jω)∣2]=E[∣X(jω)+V(jω)∣2]=E[[X(jω)+V(jω)]⋅[X∗(jω)+V∗(jω)]]=E[∣X(jω)∣2]+E[∣V(jω)∣2]=ϕxx(ω)+ϕvv(ω)(2.2.3)
其中
ϕ
x
x
(
ω
)
\phi_{xx}(\omega)
ϕxx(ω)与
ϕ
v
v
(
ω
)
\phi_{vv}(\omega)
ϕvv(ω)分别是
x
(
k
)
x(k)
x(k)与
v
(
k
)
v(k)
v(k)的功率谱密度。我们要做的就是设计一个滤波器
H
(
j
ω
)
H(j\omega)
H(jω)来得到干净语音
X
(
j
ω
)
X(j\omega)
X(jω)的估计
Z
(
j
ω
)
Z(j\omega)
Z(jω)
Z
(
j
ω
)
=
H
(
j
ω
)
Y
(
j
ω
)
=
H
(
j
ω
)
[
X
(
j
ω
)
+
V
(
j
ω
)
]
(
2.2.4
)
Z(j\omega)=H(j\omega)Y(j\omega)\\=H(j\omega)[X(j\omega)+V(j\omega)]\quad(2.2.4)
Z(jω)=H(jω)Y(jω)=H(jω)[X(jω)+V(jω)](2.2.4)
定义频域的误差信号
E
(
j
ω
)
\mathcal{E}(j\omega)
E(jω)为
E
(
j
ω
)
=
X
(
j
ω
)
−
Z
(
j
ω
)
=
X
(
j
ω
)
−
H
(
j
ω
)
Y
(
j
ω
)
(
2.2.5
)
\mathcal{E}(j\omega)=X(j\omega)-Z(j\omega)=X(j\omega)-H(j\omega)Y(j\omega)\quad(2.2.5)
E(jω)=X(jω)−Z(jω)=X(jω)−H(jω)Y(jω)(2.2.5)
则频域的均方误差(MSE)为
J
[
H
(
j
ω
)
]
=
E
[
∣
E
(
j
ω
)
∣
2
]
=
E
[
∣
X
(
j
ω
)
−
H
(
j
ω
)
Y
(
j
ω
)
∣
2
]
=
E
[
[
X
(
j
ω
)
−
H
(
j
ω
)
Y
(
j
ω
)
]
⋅
[
X
∗
(
j
ω
)
−
H
∗
(
j
ω
)
Y
∗
(
j
ω
)
]
]
=
E
[
∣
X
(
j
ω
)
∣
2
]
−
H
∗
(
j
ω
)
E
[
X
(
j
ω
)
Y
∗
(
j
ω
)
]
−
H
(
j
ω
)
E
[
Y
(
j
ω
)
X
∗
(
j
ω
)
]
+
H
(
j
ω
)
H
∗
(
j
ω
)
E
[
∣
Y
(
j
ω
)
∣
2
]
=
ϕ
x
x
(
ω
)
−
H
∗
(
j
ω
)
ϕ
x
y
(
j
ω
)
−
H
(
j
ω
)
ϕ
y
x
(
j
ω
)
+
H
(
j
ω
)
H
∗
(
j
ω
)
ϕ
y
y
(
ω
)
J[H(j\omega)]=E[|\mathcal{E}(j\omega)|^{2}]=E[|X(j\omega)-H(j\omega)Y(j\omega)|^{2}]\\=E\big[[X(j\omega)-H(j\omega)Y(j\omega)]\cdot\big[X^{*}(j\omega)-H^{*}(j\omega)Y^{*}(j\omega)\big]\big]\\=E[|X(j\omega)|^{2}]-H^{*}(j\omega)E[X(j\omega)Y^{*}(j\omega)]-H(j\omega)E[Y(j\omega)X^{*}(j\omega)]+H(j\omega)H^{*}(j\omega)E[|Y(j\omega)|^{2}]\\=\phi_{xx}(\omega)-H^{*}(j\omega)\phi_{xy}(j\omega)-H(j\omega)\phi_{yx}(j\omega)+H(j\omega)H^{*}(j\omega)\phi_{yy}(\omega)
J[H(jω)]=E[∣E(jω)∣2]=E[∣X(jω)−H(jω)Y(jω)∣2]=E[[X(jω)−H(jω)Y(jω)]⋅[X∗(jω)−H∗(jω)Y∗(jω)]]=E[∣X(jω)∣2]−H∗(jω)E[X(jω)Y∗(jω)]−H(jω)E[Y(jω)X∗(jω)]+H(jω)H∗(jω)E[∣Y(jω)∣2]=ϕxx(ω)−H∗(jω)ϕxy(jω)−H(jω)ϕyx(jω)+H(jω)H∗(jω)ϕyy(ω)
其中
ϕ
x
y
(
j
ω
)
=
E
[
X
(
j
ω
)
Y
∗
(
j
ω
)
]
\phi_{xy}(j\omega)= E[X(j\omega)Y^{*}(j\omega)]
ϕxy(jω)=E[X(jω)Y∗(jω)]是
x
(
k
)
x(k)
x(k)与
y
(
k
)
y(k)
y(k)的互功率谱密度,
ϕ
y
x
(
j
ω
)
=
E
[
Y
(
j
ω
)
X
∗
(
j
ω
)
]
\phi_{yx}(j\omega)= E[Y(j\omega)X^{*}(j\omega)]
ϕyx(jω)=E[Y(jω)X∗(jω)]是
y
(
k
)
y(k)
y(k)与
x
(
k
)
x(k)
x(k)的互功率谱密度。
维纳滤波器是在均方误差准则下的最优滤波器,因此就是要找到一个
H
(
j
ω
)
H(j\omega)
H(jω)使得均方误差
J
[
H
(
j
ω
)
]
J[H(j\omega)]
J[H(jω)]最小,用下式表示
H
W
(
j
ω
)
=
arg
min
H
(
j
ω
)
J
[
H
(
j
ω
)
]
(
2.2.6
)
H_\mathrm{W}(j\omega)=\arg\min_{H(j\omega)}J[H(j\omega)]\quad(2.2.6)
HW(jω)=argH(jω)minJ[H(jω)](2.2.6)
将
J
[
H
(
j
ω
)
]
J[H(j\omega)]
J[H(jω)]对
H
(
j
ω
)
H(j\omega)
H(jω)求导并使导数等于0即可求出维纳滤波器
H
W
(
j
ω
)
H_\mathrm{W}(j\omega)
HW(jω)
∂
J
[
H
(
j
ω
)
]
∂
H
(
j
ω
)
=
−
ϕ
y
x
(
j
ω
)
+
H
W
∗
(
j
ω
)
ϕ
y
y
(
ω
)
=
0
(
2.2.7
)
\frac{\partial J[H(j\omega)]}{\partial H(j\omega)}=-\phi_{yx}(j\omega)+H_{W}{}^{*}(j\omega)\phi_{yy}(\omega)=0\quad(2.2.7)
∂H(jω)∂J[H(jω)]=−ϕyx(jω)+HW∗(jω)ϕyy(ω)=0(2.2.7)
H
W
∗
(
j
ω
)
=
ϕ
y
x
(
j
ω
)
ϕ
y
y
(
ω
)
(
2.2.8
)
H_{\mathrm{W}}^*(j\omega)=\frac{\phi_{yx}(j\omega)}{\phi_{yy}(\omega)}\quad(2.2.8)
HW∗(jω)=ϕyy(ω)ϕyx(jω)(2.2.8)
H
W
(
j
ω
)
=
ϕ
y
x
∗
(
j
ω
)
ϕ
y
y
∗
(
ω
)
=
ϕ
x
y
(
j
ω
)
ϕ
y
y
(
ω
)
(
2.2.9
)
H_{\mathrm{W}}(j\omega)=\frac{\phi_{yx}^{*}(j\omega)}{\phi_{yy}^{*}(\omega)}=\frac{\phi_{xy}(j\omega)}{\phi_{yy}(\omega)}\quad(2.2.9)
HW(jω)=ϕyy∗(ω)ϕyx∗(jω)=ϕyy(ω)ϕxy(jω)(2.2.9)
干净语音与噪声不相关,因此
ϕ
x
y
(
j
ω
)
=
E
[
X
(
j
ω
)
Y
∗
(
j
ω
)
]
=
E
[
X
(
j
ω
)
[
X
∗
(
j
ω
)
+
V
∗
(
j
ω
)
]
]
=
ϕ
x
x
(
ω
)
(
2.2.10
)
\phi_{xy}(j\omega)=E[X(j\omega)Y^{*}(j\omega)]=E\big[X(j\omega)\big[X^{*}(j\omega)+V^{*}(j\omega)\big]\big]=\phi_{xx}(\omega)\quad(2.2.10)
ϕxy(jω)=E[X(jω)Y∗(jω)]=E[X(jω)[X∗(jω)+V∗(jω)]]=ϕxx(ω)(2.2.10)
联立式(2.2.3)(2.2.9)(2.2.10)可得频域维纳滤波器
H
W
(
j
ω
)
H_\mathrm{W}(j\omega)
HW(jω)
H
W
(
j
ω
)
=
ϕ
x
y
(
j
ω
)
ϕ
y
y
(
ω
)
=
ϕ
x
x
(
ω
)
ϕ
y
y
(
ω
)
=
ϕ
y
y
(
ω
)
−
ϕ
v
v
(
ω
)
ϕ
y
y
(
ω
)
=
1
−
ϕ
v
v
(
ω
)
ϕ
y
y
(
ω
)
(
2.2.11
)
H_{\mathrm{W}}(j\omega)=\frac{\phi_{xy}(j\omega)}{\phi_{yy}(\omega)}=\frac{\phi_{xx}(\omega)}{\phi_{yy}(\omega)}=\frac{\phi_{yy}(\omega)-\phi_{vv}(\omega)}{\phi_{yy}(\omega)}=1-\frac{\phi_{vv}(\omega)}{\phi_{yy}(\omega)}\quad(2.2.11)
HW(jω)=ϕyy(ω)ϕxy(jω)=ϕyy(ω)ϕxx(ω)=ϕyy(ω)ϕyy(ω)−ϕvv(ω)=1−ϕyy(ω)ϕvv(ω)(2.2.11)
同样,由于
Y
(
j
ω
)
Y(j\omega)
Y(jω)是可以观测到的,
ϕ
y
y
(
ω
)
=
E
[
∣
Y
(
j
ω
)
∣
2
]
\phi_{yy}(\omega)=E[|Y(j\omega)|^{2}]
ϕyy(ω)=E[∣Y(jω)∣2]可以很容易估计出来,而
ϕ
v
v
(
ω
)
=
E
[
∣
V
(
j
ω
)
∣
2
]
\phi_{vv}(\omega)=E[|V(j\omega)|^{2}]
ϕvv(ω)=E[∣V(jω)∣2]则可以在纯噪声时段估计出来。
根据式(2.2.11)维纳滤波器的频域表示,一个非常明显的事实就是 H W ( j ω ) H_\mathrm{W}(j\omega) HW(jω)是介于0到1之间的,并且它是对含噪语音的每个频率分别进行滤波,当一个频率的噪声功率谱 ϕ v v ( ω ) \phi_{vv}(\omega) ϕvv(ω)较大时, H W ( j ω ) H_\mathrm{W}(j\omega) HW(jω)较小,更加抑制信号通过滤波器,而当另一个频率的噪声功率谱 ϕ v v ( ω ) \phi_{vv}(\omega) ϕvv(ω)较小时, H W ( j ω ) H_\mathrm{W}(j\omega) HW(jω)较大,即抑制输入信号通过滤波器的程度减弱。但归根结底,滤波器总是对输入信号起抑制作用,只不过当信噪比较大时,抑制作用较弱,当信噪比较小时,抑制作用较大,因此上述单通道维纳滤波进行降噪的同时也会造成语音的失真, H W ( j ω ) H_\mathrm{W}(j\omega) HW(jω)越小,则降噪越多,但是语音失真也越多。
一些应用可能需要更强的降噪能力,而另一些应用可能需要语音失真程度较小,而在降噪与语音失真之间的折中可以通过参数型维纳滤波来实现
H
P
W
(
j
ω
)
=
(
1
−
[
ϕ
v
v
(
ω
)
ϕ
y
y
(
ω
)
]
β
1
)
β
2
(
2.2.12
)
H_{\mathrm{PW}}(j\omega)=\left(1-\left[\sqrt{\frac{\phi_{vv}(\omega)}{\phi_{yy}(\omega)}}\right]^{\beta_1}\right)^{\beta_2}\quad(2.2.12)
HPW(jω)=
1−[ϕyy(ω)ϕvv(ω)]β1
β2(2.2.12)
当
(
β
1
,
β
2
)
=
(
2
,
1
)
(\beta_{1},\beta_{2})=(2,1)
(β1,β2)=(2,1)时,该参数型维纳滤波器退化成我们推导得到的维纳滤波器。当
β
1
\beta_{1}
β1越大,
β
2
\beta_{2}
β2越小时,则该滤波器降噪能力越小,语音失真程度小。当
β
1
\beta_{1}
β1越小,
β
2
\beta_{2}
β2越大时,则该滤波器降噪能力越大,语音失真程度大。
3. 多通道维纳滤波
从上节中可以发现,在单通道降噪算法中,语音失真是不可避免的。而多通道算法,即利用多个麦克风则有望在降噪的同时保证语音不失真。本节所讲述的多通道维纳滤波实际上也会造成语音的失真,但是只需在多通道维纳滤波的基础上乘以一个比例因子就能得到第四节中的最小方差无失真响应(MVDR)滤波器,其能够在保证语音不失真的同时使得输出噪声功率最小。这节比较重要的另外一个原因在于讲述了多通道的信号模型,能够帮助我们将所有单通道算法推广到多通道情况。
假设在一个房间中有一个由
N
N
N个麦克风组成的麦克风阵列以及一个声源信号
s
(
k
)
s(k)
s(k)。那么这
N
N
N个麦克风所接收到的信号为
y
n
(
k
)
=
g
n
∗
s
(
k
)
+
v
n
(
k
)
=
x
n
(
k
)
+
v
n
(
k
)
,
n
=
1
,
2
,
.
.
.
,
N
(
3.1
)
y_{n}(k)=g_{n}*s(k)+v_{n}(k)\\=x_{n}(k)+v_{n}(k),n=1,2,...,N\quad(3.1)
yn(k)=gn∗s(k)+vn(k)=xn(k)+vn(k),n=1,2,...,N(3.1)
其中
y
n
(
k
)
y_{n}(k)
yn(k)是第
n
n
n个麦克风所接收到的信号,
g
n
g_{n}
gn为声源信号
s
(
k
)
s(k)
s(k)到第
n
n
n个麦克风之间的脉冲响应,
v
n
(
k
)
v_{n}(k)
vn(k)是第
n
n
n个麦克风所接收到的噪声。同样的,假设
x
n
(
k
)
x_{n}(k)
xn(k)与
v
n
(
k
)
v_{n}(k)
vn(k)不相关并且零均值。不失一般性,我们将第一个麦克风作为参考,那么我们的目的就是从这
N
N
N个麦克风接收到的信号
y
n
(
k
)
y_{n}(k)
yn(k)中去复原
x
1
(
k
)
x_{1}(k)
x1(k)。注意:我们是去复原
x
1
(
k
)
x_{1}(k)
x1(k),而不是复原
s
(
k
)
s(k)
s(k),复原
s
(
k
)
s(k)
s(k)事实上是在去混响。
在频域上,式(3.1)可以重写为
Y
n
(
j
ω
)
=
S
(
j
ω
)
G
n
(
j
ω
)
+
V
n
(
j
ω
)
=
X
n
(
j
ω
)
+
V
n
(
j
ω
)
,
n
=
1
,
2
,
…
,
N
(
3.2
)
Y_{n}(j\omega)=S(j\omega)G_{n}(j\omega)+V_{n}(j\omega)\\=X_{n}(j\omega)+V_{n}(j\omega),n=1,2,\ldots,N\quad(3.2)
Yn(jω)=S(jω)Gn(jω)+Vn(jω)=Xn(jω)+Vn(jω),n=1,2,…,N(3.2)
用
N
N
N个观测信号来对
X
1
(
j
ω
)
X_{1}(j\omega)
X1(jω)进行线性估计得到
Z
(
j
ω
)
Z(j\omega)
Z(jω)
Z
(
j
ω
)
=
H
1
∗
(
j
ω
)
Y
1
(
j
ω
)
+
H
2
∗
(
j
ω
)
Y
2
(
j
ω
)
+
⋯
+
H
N
∗
(
j
ω
)
Y
N
(
j
ω
)
=
h
H
(
j
ω
)
y
(
j
ω
)
=
h
H
(
j
ω
)
[
x
(
j
ω
)
+
v
(
j
ω
)
]
(
3.3
)
\begin{aligned}Z(j\omega)=H_{1}^{*}(j\omega)Y_{1}(j\omega)&+H_{2}^{*}(j\omega)Y_{2}(j\omega)+\cdots+H_{N}^{*}(j\omega)Y_{N}(j\omega)\\&=\mathbf{h}^{H}(j\omega)\mathbf{y}(j\omega)\\&=\mathbf{h}^{H}(j\omega)[\mathbf{x}(j\omega)+\mathbf{v}(j\omega)]\end{aligned}\quad(3.3)
Z(jω)=H1∗(jω)Y1(jω)+H2∗(jω)Y2(jω)+⋯+HN∗(jω)YN(jω)=hH(jω)y(jω)=hH(jω)[x(jω)+v(jω)](3.3)
其中
h
(
j
ω
)
=
[
H
1
(
j
ω
)
H
2
(
j
ω
)
⋯
H
N
(
j
ω
)
]
T
↓
y
(
j
ω
)
=
[
Y
1
(
j
ω
)
Y
2
(
j
ω
)
⋯
Y
N
(
j
ω
)
]
T
x
(
j
ω
)
=
S
(
j
ω
)
[
G
1
(
j
ω
)
G
2
(
j
ω
)
⋯
G
N
(
j
ω
)
]
T
=
S
(
j
ω
)
g
(
j
ω
)
,
v
(
j
ω
)
=
[
V
1
(
j
ω
)
V
2
(
j
ω
)
⋯
V
N
(
j
ω
)
]
T
↔
\begin{gathered} \mathbf{h}(j\omega)=[H_{1}(j\omega)H_{2}(j\omega)\cdots H_{N}(j\omega)]^{T}{}_{\downarrow} \\ \mathbf{y}(j\omega)=[Y_{1}(j\omega)Y_{2}(j\omega)\cdots Y_{N}(j\omega)]^{T} \\ \mathbf{x}(j\omega)=S(j\omega)[G_{1}(j\omega)G_{2}(j\omega)\cdots G_{N}(j\omega)]^{T} \\ =S(j\omega)\mathbf{g}(j\omega), \\ \mathbf{v}(j\omega)=[V_{1}(j\omega)V_{2}(j\omega)\cdots V_{N}(j\omega)]^{T}{}_{\leftrightarrow} \end{gathered}
h(jω)=[H1(jω)H2(jω)⋯HN(jω)]T↓y(jω)=[Y1(jω)Y2(jω)⋯YN(jω)]Tx(jω)=S(jω)[G1(jω)G2(jω)⋯GN(jω)]T=S(jω)g(jω),v(jω)=[V1(jω)V2(jω)⋯VN(jω)]T↔
接下来我们就是要去设计滤波器向量
h
(
j
ω
)
\mathbf{h}(j\omega)
h(jω)以获得一个好的估计
Z
(
j
ω
)
Z(j\omega)
Z(jω)。首先写出误差信号
E
(
j
ω
)
\mathcal{E}(j\omega)
E(jω)
E
(
j
ω
)
=
X
1
(
j
ω
)
−
Z
(
j
ω
)
=
X
1
(
j
ω
)
−
h
H
(
j
ω
)
y
(
j
ω
)
=
u
H
x
(
j
ω
)
−
h
H
(
j
ω
)
[
x
(
j
ω
)
+
v
(
j
ω
)
]
=
[
u
−
h
(
j
ω
)
]
H
x
(
j
ω
)
−
h
H
(
j
ω
)
v
(
j
ω
)
(
3.4
)
\begin{gathered} \mathcal{E}(j\omega)=X_{1}(j\omega)-Z(j\omega) \\ =X_1(j\omega)-\mathbf{h}^H(j\omega)\mathbf{y}(j\omega)=\mathbf{u}^H\mathbf{x}(j\omega)-\mathbf{h}^H(j\omega)[\mathbf{x}(j\omega)+\mathbf{v}(j\omega)] \\ =[\mathbf{u}-\mathbf{h}(j\omega)]^{H}\mathbf{x}(j\omega)-\mathbf{h}^{H}(j\omega)\mathbf{v}(j\omega) \end{gathered}\quad(3.4)
E(jω)=X1(jω)−Z(jω)=X1(jω)−hH(jω)y(jω)=uHx(jω)−hH(jω)[x(jω)+v(jω)]=[u−h(jω)]Hx(jω)−hH(jω)v(jω)(3.4)
其中
u
=
[
1
0
⋯
0
0
]
T
\mathbf{u}=[1\quad0\quad\cdots\quad0\quad0]^{T}
u=[10⋯00]T为长度为
N
N
N的向量。则均方误差为
J
[
h
(
j
ω
)
]
=
E
[
∣
E
(
j
ω
)
∣
2
]
E
[
(
u
H
x
(
j
ω
)
−
h
H
(
j
ω
)
y
(
j
ω
)
)
⋅
(
x
H
(
j
ω
)
u
−
y
H
(
j
ω
)
h
(
j
ω
)
)
]
=
u
H
E
[
x
(
j
ω
)
x
H
(
j
ω
)
]
u
−
h
H
(
j
ω
)
E
[
y
(
j
ω
)
x
H
(
j
ω
)
]
u
−
u
H
E
[
x
(
j
ω
)
y
H
(
j
ω
)
]
h
(
j
ω
)
+
h
H
(
j
ω
)
E
[
y
(
j
ω
)
y
H
(
j
ω
)
]
h
(
j
ω
)
=
u
H
Φ
x
x
(
j
ω
)
u
−
h
H
(
j
ω
)
Φ
y
x
(
j
ω
)
u
−
u
H
Φ
x
y
(
j
ω
)
h
(
j
ω
)
+
h
H
(
j
ω
)
Φ
y
y
(
j
ω
)
h
(
j
ω
)
(
3.5
)
\begin{gathered} J[\mathbf{h}(j\omega)]=E[|\mathcal{E}(j\omega)|^{2}] \\ E\left[\left(\mathbf{u}^{H}\mathbf{x}(j\omega)-\mathbf{h}^{H}(j\omega)\mathbf{y}(j\omega)\right)\cdot\left(\mathbf{x}^{H}(j\omega)\mathbf{u}-\mathbf{y}^{H}(j\omega)\mathbf{h}(j\omega)\right)\right] \\ =\mathbf{u}^{H}E[\mathbf{x}(j\omega)\mathbf{x}^{H}(j\omega)]\mathbf{u}-\mathbf{h}^{H}(j\omega)E[\mathbf{y}(j\omega)\mathbf{x}^{H}(j\omega)]\mathbf{u} \\ -\mathbf{u}^HE[\mathbf{x}(j\omega)\mathbf{y}^H(j\omega)]\mathbf{h}(j\omega)+\mathbf{h}^H(j\omega)E[\mathbf{y}(j\omega)\mathbf{y}^H(j\omega)]\mathbf{h}(j\omega) \\ =\mathbf{u}^{H}\mathbf{\Phi}_{xx}(j\omega)\mathbf{u}-\mathbf{h}^{H}(j\omega)\mathbf{\Phi}_{yx}(j\omega)\mathbf{u} \\ -\mathbf{u}^{H}\mathbf{\Phi}_{xy}(j\omega)\mathbf{h}(j\omega)+\mathbf{h}^{H}(j\omega)\mathbf{\Phi}_{yy}(j\omega)\mathbf{h}(j\omega) \end{gathered}\quad(3.5)
J[h(jω)]=E[∣E(jω)∣2]E[(uHx(jω)−hH(jω)y(jω))⋅(xH(jω)u−yH(jω)h(jω))]=uHE[x(jω)xH(jω)]u−hH(jω)E[y(jω)xH(jω)]u−uHE[x(jω)yH(jω)]h(jω)+hH(jω)E[y(jω)yH(jω)]h(jω)=uHΦxx(jω)u−hH(jω)Φyx(jω)u−uHΦxy(jω)h(jω)+hH(jω)Φyy(jω)h(jω)(3.5)
同样,通过将
J
[
h
(
j
ω
)
]
J[\mathbf{h}(j\omega)]
J[h(jω)]对
h
(
j
ω
)
\mathbf{h}(j\omega)
h(jω)求梯度并使其等于0即可得到多通道维纳滤波器
h
W
(
j
ω
)
\mathbf{h}_{\mathbf{W}}(j\omega)
hW(jω)
−
u
H
Φ
x
y
(
j
ω
)
+
h
W
H
(
j
ω
)
Φ
y
y
(
j
ω
)
=
0
(
3.6
)
-\mathbf{u}^H\mathbf{\Phi}_{xy}(j\omega)+\mathbf{h}_\mathbf{W}^H(j\omega)\mathbf{\Phi}_{yy}(j\omega)=0\quad(3.6)
−uHΦxy(jω)+hWH(jω)Φyy(jω)=0(3.6)
h
W
H
(
j
ω
)
=
u
H
Φ
x
y
(
j
ω
)
Φ
y
y
−
1
(
j
ω
)
(
3.7
)
\mathbf{h_W}^H(j\omega)=\mathbf{u}^H\mathbf{\Phi}_{xy}(j\omega)\mathbf{\Phi}_{yy}^{-1}(j\omega)\quad(3.7)
hWH(jω)=uHΦxy(jω)Φyy−1(jω)(3.7)
h
W
(
j
ω
)
=
Φ
y
y
−
1
(
j
ω
)
Φ
y
x
(
j
ω
)
u
(
3.8
)
\mathbf{h_W}(j\omega)=\mathbf{\Phi_{yy}}^{-1}(j\omega)\mathbf{\Phi_{yx}}(j\omega)\mathbf{u}\quad(3.8)
hW(jω)=Φyy−1(jω)Φyx(jω)u(3.8)
由于噪声与语音不相关,有
Φ
y
x
(
j
ω
)
=
E
[
y
(
j
ω
)
x
H
(
j
ω
)
]
=
E
[
[
x
(
j
ω
)
+
v
(
j
ω
)
]
x
H
(
j
ω
)
]
=
E
[
x
(
j
ω
)
x
H
(
j
ω
)
]
=
Φ
x
x
(
j
ω
)
Φ
y
y
(
j
ω
)
=
E
[
y
(
j
ω
)
y
H
(
j
ω
)
]
=
E
[
[
x
(
j
ω
)
+
v
(
j
ω
)
]
⋅
[
x
H
(
j
ω
)
+
v
H
(
j
ω
)
]
]
=
E
[
x
(
j
ω
)
x
H
(
j
ω
)
]
+
E
[
v
(
j
ω
)
v
H
(
j
ω
)
]
=
Φ
x
x
(
j
ω
)
+
Φ
v
v
(
j
ω
)
\begin{aligned}\mathbf{\Phi}_{yx}(j\omega)&= E[\mathbf{y}(j\omega)\mathbf{x}^{H}(j\omega)]= E[[\mathbf{x}(j\omega)+\mathbf{v}(j\omega)]\mathbf{x}^{H}(j\omega)]=E[\mathbf{x}(j\omega)\mathbf{x}^{H}(j\omega)]\\&=\mathbf{\Phi}_{xx}(j\omega)\\\mathbf{\Phi}_{yy}(j\omega)&=E[\mathbf{y}(j\omega)\mathbf{y}^{H}(j\omega)]= E[[\mathbf{x}(j\omega)+\mathbf{v}(j\omega)]\cdot[\mathbf{x}^{H}(j\omega)+\mathbf{v}^{H}(j\omega)]]\\&=E[\mathbf{x}(j\omega)\mathbf{x}^{H}(j\omega)]+E[\mathbf{v}(j\omega)\mathbf{v}^{H}(j\omega)]=\mathbf{\Phi}_{xx}(j\omega)+\mathbf{\Phi}_{vv}(j\omega)\end{aligned}
Φyx(jω)Φyy(jω)=E[y(jω)xH(jω)]=E[[x(jω)+v(jω)]xH(jω)]=E[x(jω)xH(jω)]=Φxx(jω)=E[y(jω)yH(jω)]=E[[x(jω)+v(jω)]⋅[xH(jω)+vH(jω)]]=E[x(jω)xH(jω)]+E[v(jω)vH(jω)]=Φxx(jω)+Φvv(jω)
因此多通道维纳滤波器
h
W
(
j
ω
)
\mathbf{h_W}(j\omega)
hW(jω)也可写为
h
W
(
j
ω
)
=
Φ
y
y
−
1
(
j
ω
)
Φ
x
x
(
j
ω
)
u
=
Φ
y
y
−
1
(
j
ω
)
[
Φ
y
y
(
j
ω
)
−
Φ
v
v
(
j
ω
)
]
u
=
[
I
N
×
N
−
Φ
y
y
−
1
(
j
ω
)
Φ
v
v
(
j
ω
)
]
u
(
3.9
)
\mathbf{h}_{\mathbf{W}}(j\omega)=\mathbf{\Phi}_{yy}{}^{-1}(j\omega)\mathbf{\Phi}_{xx}(j\omega)\mathbf{u}=\mathbf{\Phi}_{yy}{}^{-1}(j\omega)\big[\mathbf{\Phi}_{yy}(j\omega)-\mathbf{\Phi}_{vv}(j\omega)\big]\mathbf{u}\\=\left[\mathbf{I}_{N\times N}-\mathbf{\Phi}_{yy}^{-1}(j\omega)\mathbf{\Phi}_{vv}(j\omega)\right]\mathbf{u}\quad(3.9)
hW(jω)=Φyy−1(jω)Φxx(jω)u=Φyy−1(jω)[Φyy(jω)−Φvv(jω)]u=[IN×N−Φyy−1(jω)Φvv(jω)]u(3.9)
利用伍德伯里矩阵恒等式可以将
h
W
(
j
ω
)
\mathbf{h_W}(j\omega)
hW(jω)写成另外一种有趣的形式(实际中利用(3.9)就能够实现多通道维纳滤波,写成(3.10)的形式主要是为了揭示多通道维纳滤波器与第四节中的MVDR滤波器之间的关系,并且由于推导过程较为繁琐,因此在此并没有具体写出推导过程)。
h
W
(
j
ω
)
=
Φ
v
v
−
1
(
j
ω
)
Φ
x
x
(
j
ω
)
1
+
t
r
[
Φ
v
v
−
1
(
j
ω
)
Φ
x
x
(
j
ω
)
]
u
(
3.10
)
\mathbf{h}_\mathrm{W}(j\omega)=\frac{\mathbf{\Phi}_{vv}^{-1}(j\omega)\mathbf{\Phi}_{xx}(j\omega)}{1+\mathrm{tr}[\mathbf{\Phi}_{vv}^{-1}(j\omega)\mathbf{\Phi}_{xx}(j\omega)]}\mathbf{u}\quad(3.10)
hW(jω)=1+tr[Φvv−1(jω)Φxx(jω)]Φvv−1(jω)Φxx(jω)u(3.10)
多通道维纳滤波实际上也会造成语音的失真,但是只需在多通道维纳滤波的基础上乘以一个比例因子就能做到降噪的同时保证语音不失真,也就是我们下一节将要讲述的最小方差无失真响应(MVDR)滤波器。
4. 最小方差无失真响应(MVDR)滤波器
滤波器
h
(
j
ω
)
\mathbf{h}(j\omega)
h(jω)对观测信号
y
(
j
ω
)
\mathbf{y}(j\omega)
y(jω)的作用可以分为两部分
h
H
(
j
ω
)
y
(
j
ω
)
=
h
H
(
j
ω
)
x
(
j
ω
)
+
h
H
(
j
ω
)
v
(
j
ω
)
\mathbf{h}^H(j\omega)\mathbf{y}(j\omega)=\mathbf{h}^H(j\omega)\mathbf{x}(j\omega)+\mathbf{h}^H(j\omega)\mathbf{v}(j\omega)
hH(jω)y(jω)=hH(jω)x(jω)+hH(jω)v(jω)
最理想的情况就是
h
H
(
j
ω
)
x
(
j
ω
)
=
X
1
(
j
ω
)
\mathbf{h}^{H}(j\omega)\mathbf{x}(j\omega)=X_{1}(j\omega)
hH(jω)x(jω)=X1(jω)且
h
H
(
j
ω
)
v
(
j
ω
)
=
0
\mathbf{h}^{H}(j\omega)\mathbf{v}(j\omega)=0
hH(jω)v(jω)=0,即滤波器输出的语音信号无失真,且无噪声,但是实际上这是不可能的。而最小方差无失真响应(MVDR)滤波器的目的则是使滤波器输出的噪声功率最小,同时满足期望信号不失真的约束。
满足期望信号不失真的约束可用下式描述
h
H
(
j
ω
)
x
(
j
ω
)
=
X
1
(
j
ω
)
(
4.1
)
\mathbf{h}^{H}(j\omega)\mathbf{x}(j\omega)=X_{1}(j\omega)\quad(4.1)
hH(jω)x(jω)=X1(jω)(4.1)
即
[
u
−
h
(
j
ω
)
]
H
x
(
j
ω
)
=
0
(
4.2
)
[\mathbf{u}-\mathbf{h}(j\omega)]^H\mathbf{x}(j\omega)=0\quad(4.2)
[u−h(jω)]Hx(jω)=0(4.2)
在第三节中有
x
(
j
ω
)
=
S
(
j
ω
)
g
(
j
ω
)
\mathbf{x}(j\omega)=S(j\omega)\mathbf{g}(j\omega)
x(jω)=S(jω)g(jω),代入到(4.2)中易得
h
H
(
j
ω
)
g
(
j
ω
)
=
G
1
(
j
ω
)
(
4.3
)
\mathbf{h}^H(j\omega)\mathbf{g}(j\omega)=G_1(j\omega)\quad(4.3)
hH(jω)g(jω)=G1(jω)(4.3)
滤波器输出的噪声为
h
H
(
j
ω
)
v
(
j
ω
)
\mathbf{h}^{H}(j\omega)\mathbf{v}(j\omega)
hH(jω)v(jω),因此滤波器输出噪声功率为
E
[
h
H
(
j
ω
)
v
(
j
ω
)
v
H
(
j
ω
)
h
(
j
ω
)
]
=
h
H
(
j
ω
)
Φ
v
v
(
j
ω
)
h
(
j
ω
)
(
4.4
)
E[\mathbf{h}^{H}(j\omega)\mathbf{v}(j\omega)\mathbf{v}^{H}(j\omega)\mathbf{h}(j\omega)]=\mathbf{h}^{H}(j\omega)\mathbf{\Phi}_{vv}(j\omega)\mathbf{h}(j\omega)\quad(4.4)
E[hH(jω)v(jω)vH(jω)h(jω)]=hH(jω)Φvv(jω)h(jω)(4.4)
因此MVDR滤波器问题可以写成下述优化问题
min
h
(
j
ω
)
h
H
(
j
ω
)
Φ
v
v
(
j
ω
)
h
(
j
ω
)
subject to
h
H
(
j
ω
)
g
(
j
ω
)
=
G
1
(
j
ω
)
(
4.5
)
\min\limits_{\mathbf{h}(j\omega)}\mathbf{h}^H(j\omega)\mathbf{\Phi}_{vv}(j\omega)\mathbf{h}(j\omega)\text{ subject to }\mathbf{h}^H(j\omega)\mathbf{g}(j\omega)=G_1(j\omega)\quad(4.5)
h(jω)minhH(jω)Φvv(jω)h(jω) subject to hH(jω)g(jω)=G1(jω)(4.5)
这种优化问题可以利用拉格朗日乘子法求解
L
(
h
(
j
ω
)
,
λ
)
=
h
H
(
j
ω
)
Φ
v
v
(
j
ω
)
h
(
j
ω
)
+
λ
[
g
H
(
j
ω
)
h
(
j
ω
)
−
G
1
∗
(
j
ω
)
]
+
λ
∗
[
h
H
(
j
ω
)
g
(
j
ω
)
−
G
1
(
j
ω
)
]
L(\mathbf{h}(j\omega),\lambda)=\mathbf{h}^H(j\omega)\mathbf{\Phi}_{vv}(j\omega)\mathbf{h}(j\omega)+\lambda[\mathbf{g}^H(j\omega)\mathbf{h}(j\omega)-G_1^*(j\omega)]+\lambda^*[\mathbf{h}^H(j\omega)\mathbf{g}(j\omega)-G_1(j\omega)]
L(h(jω),λ)=hH(jω)Φvv(jω)h(jω)+λ[gH(jω)h(jω)−G1∗(jω)]+λ∗[hH(jω)g(jω)−G1(jω)]
∂
L
(
h
(
j
ω
)
,
λ
)
∂
h
(
j
ω
)
=
h
H
(
j
ω
)
Φ
v
v
(
j
ω
)
+
λ
g
H
(
j
ω
)
=
0
\frac{\partial L(\mathbf{h}(j\omega),\lambda)}{\partial\mathbf{h}(j\omega)}=\mathbf{h}^H(j\omega)\mathbf{\Phi}_{vv}(j\omega)+\lambda\mathbf{g}^H(j\omega)=0
∂h(jω)∂L(h(jω),λ)=hH(jω)Φvv(jω)+λgH(jω)=0
h
H
(
j
ω
)
=
−
λ
g
H
(
j
ω
)
Φ
v
v
−
1
(
j
ω
)
(
4.6
)
\mathbf{h}^{H}(j\omega)= -\lambda\mathbf{g}^{H}(j\omega)\mathbf{\Phi}_{vv}^{-1}(j\omega)\quad(4.6)
hH(jω)=−λgH(jω)Φvv−1(jω)(4.6)
h
(
j
ω
)
=
−
λ
∗
Φ
v
v
−
1
(
j
ω
)
g
(
j
ω
)
(
4.7
)
\mathbf{h}(j\omega)=-\lambda^*\mathbf{\Phi}_{vv}{}^{-1}(j\omega)\mathbf{g}(j\omega)\quad(4.7)
h(jω)=−λ∗Φvv−1(jω)g(jω)(4.7)
将约束
h
H
(
j
ω
)
g
(
j
ω
)
=
G
1
(
j
ω
)
\mathbf{h}^H(j\omega)\mathbf{g}(j\omega)=G_1(j\omega)
hH(jω)g(jω)=G1(jω)代入到(4.6)可得
G
1
(
j
ω
)
=
−
λ
g
H
(
j
ω
)
Φ
v
v
−
1
(
j
ω
)
g
(
j
ω
)
λ
=
−
G
1
(
j
ω
)
g
H
(
j
ω
)
Φ
v
v
−
1
(
j
ω
)
g
(
j
ω
)
(
4.8
)
G_{1}(j\omega)=-\lambda\mathbf{g}^{H}(j\omega)\mathbf{\Phi}_{vv}^{-1}(j\omega)\mathbf{g}(j\omega)\\\lambda=\frac{-G_{1}(j\omega)}{\mathbf{g}^{H}(j\omega)\mathbf{\Phi}_{vv}^{-1}(j\omega)\mathbf{g}(j\omega)}\quad(4.8)
G1(jω)=−λgH(jω)Φvv−1(jω)g(jω)λ=gH(jω)Φvv−1(jω)g(jω)−G1(jω)(4.8)
将(4.8)代入到(4.7)即可得到MVDR滤波器
h
M
V
D
R
(
j
ω
)
=
G
1
∗
(
j
ω
)
Φ
v
v
−
1
(
j
ω
)
g
(
j
ω
)
g
H
(
j
ω
)
Φ
v
v
−
1
(
j
ω
)
g
(
j
ω
)
(
4.9
)
\mathbf{h}_{\mathrm{MVDR}}(j\omega)=G_1{}^*(j\omega)\frac{\mathbf{\Phi}_{vv}{}^{-1}(j\omega)\mathbf{g}(j\omega)}{\mathbf{g}^H(j\omega)\mathbf{\Phi}_{vv}{}^{-1}(j\omega)\mathbf{g}(j\omega)}\quad(4.9)
hMVDR(jω)=G1∗(jω)gH(jω)Φvv−1(jω)g(jω)Φvv−1(jω)g(jω)(4.9)
类似(3.10),(4.9)也可写成另外一些更有趣的形式
h
M
V
D
R
(
j
ω
)
=
Φ
v
v
−
1
(
j
ω
)
Φ
x
x
(
j
ω
)
t
r
[
Φ
v
v
−
1
(
j
ω
)
Φ
x
x
(
j
ω
)
]
u
(
4.10
)
h
M
V
D
R
(
j
ω
)
=
Φ
v
v
−
1
(
j
ω
)
Φ
y
y
(
j
ω
)
−
I
N
×
N
t
r
[
Φ
v
v
−
1
(
j
ω
)
Φ
y
y
(
j
ω
)
]
−
N
u
(
4.11
)
\mathbf{h}_{\mathrm{MVDR}}(j\omega)=\frac{\mathbf{\Phi}_{vv}^{-1}(j\omega)\mathbf{\Phi}_{xx}(j\omega)}{\mathrm{tr}[\mathbf{\Phi}_{vv}^{-1}(j\omega)\mathbf{\Phi}_{xx}(j\omega)]}\mathbf{u}\quad(4.10)\\\mathbf{h}_{\mathrm{MVDR}}(j\omega)=\frac{\mathbf{\Phi}_{vv}^{-1}(j\omega)\mathbf{\Phi}_{yy}(j\omega)-\mathbf{I}_{N\times N}}{\mathrm{tr}[\mathbf{\Phi}_{vv}^{-1}(j\omega)\mathbf{\Phi}_{yy}(j\omega)]-N}\mathbf{u}\quad(4.11)
hMVDR(jω)=tr[Φvv−1(jω)Φxx(jω)]Φvv−1(jω)Φxx(jω)u(4.10)hMVDR(jω)=tr[Φvv−1(jω)Φyy(jω)]−NΦvv−1(jω)Φyy(jω)−IN×Nu(4.11)
对比(3.10)与(4.10),我们可以发现MVDR滤波器
h
M
V
D
R
(
j
ω
)
\mathbf{h}_{\mathrm{MVDR}}(j\omega)
hMVDR(jω)与多通道维纳滤波器
h
W
(
j
ω
)
\mathbf{h}_{\mathrm{W}}(j\omega)
hW(jω)的关系
h
W
(
j
ω
)
=
t
r
[
Φ
v
v
−
1
(
j
ω
)
Φ
x
x
(
j
ω
)
]
1
+
t
r
[
Φ
v
v
−
1
(
j
ω
)
Φ
x
x
(
j
ω
)
]
h
M
V
D
R
(
j
ω
)
=
c
(
ω
)
h
M
V
D
R
(
j
ω
)
(
4.12
)
\mathbf{h}_{\mathrm{W}}(j\omega)=\frac{\mathrm{tr}[\mathbf{\Phi}_{vv}^{-1}(j\omega)\mathbf{\Phi}_{xx}(j\omega)]}{1+\mathrm{tr}[\mathbf{\Phi}_{vv}^{-1}(j\omega)\mathbf{\Phi}_{xx}(j\omega)]}\mathbf{h}_{\mathrm{MVDR}}(j\omega)=c(\omega)\mathbf{h}_{\mathrm{MVDR}}(j\omega)\quad(4.12)
hW(jω)=1+tr[Φvv−1(jω)Φxx(jω)]tr[Φvv−1(jω)Φxx(jω)]hMVDR(jω)=c(ω)hMVDR(jω)(4.12)
从(4.12)不难看出,MVDR滤波器与多通道维纳滤波器之间就差了一个比例因子,因此它们在每个频率上的输出SNR是相等的,不同的是MVDR滤波器的比例因子能够保证输入的语音信号不失真。
实践中MVDR滤波器可以通过(4.9)或者(4.11)来实现。一般来讲,(4.11)相比于(4.9)更容易实现,毕竟估计声源到麦克风之间的脉冲响应 g ( j ω ) \mathbf{g}(j\omega) g(jω)有时候不是一件容易的事情。
总结一下,在所有单通道算法中,降噪和语音失真之间总是存在折中,但对于设计良好的多通道算法来说,在不失真所需信号的情况下也可以实现大量的降噪,即我们的MVDR滤波器。