鲁棒自适应波束形成
本文是我关于Microphone Arrays Signal Processing Techniques and Applications第五章的整理。
自适应形成其方向性的波束形成器称为自适应波束形成器。它同时进行波束控制和零位控制。然而,在大多数声波束形成器中,只有在目标DOA是先验已知的假设下进行零转向。由于自适应处理,即使在传播模型中存在错误,也可以产生深度零值。因此,自适应波束形成器自然比固定波束形成器具有更高的抗干扰能力。在各种自适应波束形成器中,格里菲斯-吉姆波束形成器(GJBF),或广义旁瓣抵消器,是最广为人知的。
GJBF波束形成包括固定波束形成器(FBF)、多输入抵消器(MC)和阻塞矩阵(BM)。
FBF设计成在注视方向上形成一波束,使目标信号通过而其他信号都被衰减。相反,BM在注视方向上形成一个零,目标信号被抑制,所有其他信号都被通过。BM最简单的结构是前一节描述的延迟减法波束形成器。假设视场方向垂直于阵列面,则不需要延迟单元。因此,一组取相邻麦克风信号差值的减法器可以用作BM。这个结构实际如下图所示。BM功能是阻挡目标信号,故命名阻塞矩阵。
GJBF可以被认为是一个具有多个参考信号的自适应噪声消除器,每个参考信号都经过BM的预处理。在自适应噪声消除器中,辅助麦克风位于噪声源附近,以获得可能的最佳噪声参考。
图2BM的零位和FBF的主瓣(波束)位于目标方向。从图中还可以清楚地看出,它们是互相正交的。图1中的BM具有简单的时延和求和结构,但也可以采用滤波器和波束形成器。
由于目标的 x n ( k ) x_{n}(k) xn(k)和 x n + 1 ( k ) x_{n+1}(k) xn+1(k)之间存在不理想的相位差,导致导向矢量误差导致目标信号对消。相位误差导致目标信号泄漏到BM输出信号中。因此,对目标的阻塞变得不完全,从而导致麦克风阵列输出的目标信号相消。导向矢量误差是不可避免的。
减少目标信号对消的技术主要是在天线和雷达领域提出的。采用这些技术的波束形成器称为鲁棒波束形成器。 典型的方法是减少BM输出中的目标信号泄漏和抑制MC中的系数增长,前者可以看作是减少BM输出中的目标泄漏的一种直接方法。后者采取间接方法的形式。即使作为MC输入的BM输出中存在目标泄漏,MC也会尽量减小其影响。
鲁棒自适应麦克风阵列——LAF-LAF Structure
针对目标信号对消的问题,提出了一种基于泄漏自适应滤波器的目标跟踪方法。该算法采用漏频自适应滤波器(leaky adaptive filters ),缓解了相位误差的影响,增强了鲁棒性。该结构在实际DOAs与假设DOAs误差较大的情况下,能够接收到失真小的目标信号。
其中
z
n
(
k
)
=
x
n
(
k
−
L
2
)
−
h
n
T
(
k
)
b
(
k
)
h
n
(
k
)
≜
[
h
n
,
0
(
k
)
,
h
n
,
1
(
k
)
,
…
,
h
n
,
M
1
−
1
(
k
)
]
T
b
(
k
)
≜
[
b
(
k
)
,
b
(
k
−
1
)
,
…
,
b
(
k
−
M
1
+
1
)
]
T
\begin{aligned} z_{n}(k) &=x_{n}\left(k-L_{2}\right)-\mathbf{h}_{n}^{T}(k) \mathbf{b}(k) \\ \mathbf{h}_{n}(k) & \triangleq\left[h_{n, 0}(k), h_{n, 1}(k), \ldots, h_{n, M_{1}-1}(k)\right]^{T} \\ \mathbf{b}(k) & \triangleq\left[b(k), b(k-1), \ldots, b\left(k-M_{1}+1\right)\right]^{T} \end{aligned}
zn(k)hn(k)b(k)=xn(k−L2)−hnT(k)b(k)≜[hn,0(k),hn,1(k),…,hn,M1−1(k)]T≜[b(k),b(k−1),…,b(k−M1+1)]T
x
n
(
k
)
x_{n}(k)
xn(k)为第n个麦克风信号。
L
2
L_{2}
L2为因果关系的延迟样本数,
h
n
(
k
)
\mathbf{h}_{n}(k)
hn(k)为第n个LAF的系数向量,
b
(
k
)
\mathbf{b}(k)
b(k)为b(k)的延迟信号组成的信号向量(即FBF输出)。假设每个LAF有
M
1
M_{1}
M1抽头(系数)。归一化LMS (NLMS)算法的自适应描述如下:
h
n
(
k
+
1
)
=
h
n
(
k
)
−
δ
⋅
h
n
(
k
)
+
α
z
n
(
k
)
b
(
k
)
T
b
(
k
)
b
(
k
)
\mathbf{h}_{n}(k+1)=\mathbf{h}_{n}(k)-\delta \cdot \mathbf{h}_{n}(k)+\alpha \frac{z_{n}(k)}{\mathbf{b}(k)^{T} \mathbf{b}(k)} \mathbf{b}(k)
hn(k+1)=hn(k)−δ⋅hn(k)+αb(k)Tb(k)zn(k)b(k)
α
\alpha
α为自适应算法的步长,
δ
\delta
δ为泄漏常数。
为了增强在BM中获得的鲁棒性,在MC中也使用了LAFs。MC的抽头系数向量
w
n
(
k
)
\mathbf{w}_{n}(k)
wn(k)有
M
2
M_{2}
M2抽头。
w
n
(
k
+
1
)
=
w
n
(
k
)
−
γ
⋅
w
n
(
k
)
+
β
y
n
(
k
)
z
(
k
)
T
z
(
k
)
z
(
k
)
\mathbf{w}_{n}(k+1)=\mathbf{w}_{n}(k)-\gamma\cdot \mathbf{w}_{n}(k)+\beta \frac{y_{n}(k)}{\mathbf{z}(k)^{T} \mathbf{z}(k)} \mathbf{z}(k)
wn(k+1)=wn(k)−γ⋅wn(k)+βz(k)Tz(k)yn(k)z(k)
β
\beta
β为自适应算法的步长,
γ
\gamma
γ为泄漏常数。可能与
δ
\delta
δ、
α
\alpha
α取不同的值。
BM中的目标信号泄漏足够小,即使对于较大的视向误差,也可以在MC中使用最小泄漏常数
γ
\gamma
γ。这样的值
γ
\gamma
γ导致MC中有更高的干扰抑制性能。从FBF输出的
L
1
L_{1}
L1样本延迟版本中对LAFs的输出进行求和和减去,生成麦克风阵列输出y(k)。
允许目标DOA的宽度由泄漏常数和BM和MC中的步长决定,一般情况下,这些参数的值越小,允许目标DOA的宽度越宽。然而,目标的允许DOA宽度并不是参数的简单函数,也不容易规定。在目标信号对消程度和干扰抑制量之间存在权衡。
鲁棒自适应麦克风阵列-CCAF-LAF Structure
一个更有效的解决方案是在BM中使用系数约束自适应滤波器(CCAFs)(coefficient-constrained adaptive filters )。如下图所示,当在MC中结合泄漏自适应滤波器时,结果称为CCAF-LAF结构。
ccaf的行为类似于自适应噪声消除器。每个CCAF的输入信号是FBF的输出,CCAF的输出从延迟麦克风信号中减去。CCAF系数向量hn(k)具有约束条件。NLMS算法的自适应描述如下:
h
n
′
(
k
+
1
)
=
h
n
(
k
)
+
α
z
n
(
k
)
b
(
k
)
T
b
(
k
)
b
(
k
)
h
n
(
k
+
1
)
=
{
ϕ
n
,
for
h
n
′
(
k
+
1
)
>
ϕ
n
ψ
n
,
for
h
n
′
(
k
+
1
)
<
ψ
n
h
n
′
(
k
+
1
)
,
otherwise
ϕ
n
≜
[
ϕ
n
,
0
,
ϕ
n
,
1
,
⋯
,
ϕ
n
,
M
1
−
1
]
T
ψ
n
≜
[
ψ
n
,
0
,
ψ
n
,
1
,
⋯
,
ψ
n
,
M
1
−
1
]
T
\begin{aligned} &\mathbf{h}_{n}^{\prime}(k+1)=\mathbf{h}_{n}(k)+\alpha \frac{z_{n}(k)}{\mathbf{b}(k)^{T} \mathbf{b}(k)} \mathbf{b}(k) \\ &\mathbf{h}_{n}(k+1)=\left\{\begin{array}{cl} \phi_{n}, & \text { for } \mathbf{h}_{n}^{\prime}(k+1)>\phi_{n} \\ \psi_{n}, & \text { for } \mathbf{h}_{n}^{\prime}(k+1)<\psi_{n} \\ \mathbf{h}_{n}^{\prime}(k+1), & \text { otherwise } \end{array}\right. \end{aligned} \\ \begin{aligned} \phi_{n} & \triangleq\left[\phi_{n, 0}, \phi_{n, 1}, \cdots, \phi_{n, M_{1}-1}\right]^{T} \\ \psi_{n} & \triangleq\left[\psi_{n, 0}, \psi_{n, 1}, \cdots, \psi_{n, M_{1}-1}\right]^{T} \end{aligned}
hn′(k+1)=hn(k)+αb(k)Tb(k)zn(k)b(k)hn(k+1)=⎩⎨⎧ϕn,ψn,hn′(k+1), for hn′(k+1)>ϕn for hn′(k+1)<ψn otherwise ϕnψn≜[ϕn,0,ϕn,1,⋯,ϕn,M1−1]T≜[ψn,0,ψn,1,⋯,ψn,M1−1]T
假设每个CCAF有
M
1
M_{1}
M1抽头,
h
n
′
(
k
+
1
)
\mathbf{h}_{n}^{\prime}(k+1)
hn′(k+1)是限制函数的时间系数向量。
ϕ
n
\phi_{n}
ϕn和
ψ
n
\psi_{n}
ψn是CCAF系数向量的上限和下限。在输出信号
z
n
(
k
)
z_{n}(k)
zn(k)中,与b(k)相关的分量被CCAFs消去。
基于目标信号最小化的滤波系数随目标方位的变化而变化的特点,对CCAFs的各系数进行了约束。下图给出了滤波系数变化的一个例子。通过设计CCAF系数的约束区域,可以指定最大允许的视向误差。例如,当CCAF系数被限制在下图的阴影区域时,在视向上最多可以允许20°的误差。只有来自有限DOA区域的信号在BM的输出处达到最小,并保持在MC的输出处。如果该区域不存在干扰,这在麦克风阵列中很常见,就不会发生误报。关于上界和下界的设计细节,请参阅其他文献。
LAF和CCAF比较
LAF和CCAF之间关于信号阻塞最优时的视向误差和系数误差的定性比较。
CCAF和LAF都给出了近似理想非线性的目标跟踪误差特性。然而,CCAF的系数误差比LAF的系数误差更接近理想非线性,如图所示。CCAF的系数误差只有在注视方向误差超过阈值时才有效,否则没有影响。另一方面,LAF的系数误差随视向误差不断变化。因此,CCAF可以实现精确的目标跟踪,从而实现更清晰的空间选择性和更小的目标信号对消。
CCAF-NCAF Structure
可以将BM与CCAFs结合,将MC与范数限制自适应滤波器(norm-constrained adaptive filters) (NCAFs)结合。这是一个CCAF-NCAF结构:
NCAFs从
b
(
k
−
L
1
)
\mathbf{b}(k-L_{1})
b(k−L1)中减去与
z
n
(
k
)
\mathbf{z}_{n}(k)
zn(k)相关的成分(n = 0,…N -1)。设
M
2
M_{2}
M2为每个NCAF的快拍数,
w
n
(
k
)
\mathbf{w}_{n}(k)
wn(k)和
z
n
(
k
)
\mathbf{z}_{n}(k)
zn(k)分别为第n个NCAF的系数向量和信号向量。MC中的信号处理描述为
y
(
k
)
=
b
(
k
−
L
1
)
−
∑
n
=
0
N
−
1
w
n
T
(
k
)
z
n
(
k
)
w
n
(
k
)
≜
[
w
n
,
0
(
k
)
,
w
n
,
1
(
k
)
,
…
,
w
n
,
M
2
−
1
(
k
)
]
T
z
n
(
k
)
≜
[
z
n
(
k
)
,
z
n
(
k
−
1
)
,
…
,
z
n
(
k
−
M
2
+
1
)
]
T
y(k)=b\left(k-L_{1}\right)-\sum_{n=0}^{N-1} \mathbf{w}_{n}^{T}(k) \mathbf{z}_{n}(k) \\ \begin{aligned} &\mathbf{w}_{n}(k) \triangleq\left[w_{n, 0}(k), w_{n, 1}(k), \ldots, w_{n, M_{2}-1}(k)\right]^{T} \\ &\mathbf{z}_{n}(k) \triangleq\left[z_{n}(k), z_{n}(k-1), \ldots, z_{n}\left(k-M_{2}+1\right)\right]^{T} \end{aligned}
y(k)=b(k−L1)−n=0∑N−1wnT(k)zn(k)wn(k)≜[wn,0(k),wn,1(k),…,wn,M2−1(k)]Tzn(k)≜[zn(k),zn(k−1),…,zn(k−M2+1)]T
采用带范数约束的自适应算法对神经网络的系数进行更新。NLMS算法的适应性描述如下:
w
n
′
=
w
n
(
k
)
+
β
y
(
k
)
z
j
(
k
)
T
z
j
(
k
)
z
n
(
k
)
Ω
=
w
n
′
T
w
n
′
w
n
(
k
+
1
)
=
{
K
Ω
w
n
′
for
Ω
>
K
w
n
′
otherwise
\begin{aligned} \mathbf{w}_{n}^{\prime} &=\mathbf{w}_{n}(k)+\beta \frac{y(k)}{\mathbf{z}_{j}(k)^{T} \mathbf{z}_{j}(k)} \mathbf{z}_{n}(k) \\ \Omega &=\mathbf{w}_{n}^{\prime T} \mathbf{w}_{n}^{\prime} \\ \mathbf{w}_{n}(k+1) &=\left\{\begin{array}{cl} \sqrt{\frac{K}{\Omega}} \mathbf{w}_{n}^{\prime} & \text { for } \Omega>K \\ \mathbf{w}_{n}^{\prime} & \text { otherwise } \end{array}\right. \end{aligned}
wn′Ωwn(k+1)=wn(k)+βzj(k)Tzj(k)y(k)zn(k)=wn′Twn′={ΩKwn′wn′ for Ω>K otherwise
其中
β
\beta
β和
w
n
(
k
)
\mathbf{w}_{n}(k)
wn(k)分别为约束的步长和时间向量。
Ω
\Omega
Ω和
K
K
K是
w
n
(
k
)
\mathbf{w}_{n}(k)
wn(k)的总平方范数和一个阈值。如果
Ω
\Omega
Ω超过
K
K
K,
w
n
(
k
+
1
)
\mathbf{w}_{n}(k+1)
wn(k+1)被缩放限制。标度的范数约束抑制了NCAF系数的过度增长。当目标信号泄漏到NCAF输入时,抑制不希望的目标消除。
如果BM的输出没有目标信号,MC只抵消干扰信号。在这种理想情况下,MC中不需要规范约束。然而,在BM中,由于实际环境中存在反射和混响,完全抑制目标信号几乎是不可能的。为了在混响环境中完全消除目标信号,BM中每个CCAF需要超过1000次快拍数。这样大量的快拍数会导致收敛速度慢、调整误差大、计算量增加。
BM和MC的适应应交替进行。
- 因为BM中自适应算法的期望信号和噪声的关系与MC中相反,BM中自适应算法的目标信号是期望信号,噪声是不期望信号。然而,在MC中,噪声是期望信号,而目标信号是不期望信号。
不太明白原书这段话意思,感觉莫名其妙。这本书前面说BM是阻塞矩阵,功能是阻挡目标信号。MC由多个自适应滤波器组成,每个滤波器由BM输出zn(k)驱动。BM输出zn(k)包含了除注视方向外的所有信号分量。在这些信号的基础上,MC自适应滤波器生成与干扰相关的组件的副本。然后到这就是BM中自适应算法的目标信号是期望信号,噪声是不期望信号。如果大家理解,欢迎评论。
在目前讨论的鲁棒自适应波束形成器中,隐式假设BM中的自适应滤波器仅在有目标信号时自适应,MC中的自适应滤波器仅在无目标信号时自适应。但在实际环境中,情况并非如此简单,因为BM的不正确适应可能导致目标不完全阻塞。因此,MC方向性可能在目标信号的方向上为零,导致目标信号相消。结合BM的目标跟踪,仅在目标信号不存在时自适应系数是增加自适应波束形成鲁棒性的有效策略。为了区分目标的活跃周期和不活跃周期,需要一个自适应模式控制器adaptation mode controller (AMC) 。
AMC通过对目标信号的估计来控制BM和MC的自适应。SIR估计为FBF的输出信号
b
(
k
)
\mathbf{b}(k)
b(k)与BM的输出信号
z
n
(
k
)
\mathbf{z}_{n}(k)
zn(k)的功率比。FBF输出的主要成分是目标信号,BM输出的主要成分是噪声。因此,可以将功率比s(k)视为SIR的直接估计,当功率比大于阈值
η
\eta
η时,进行BM的自适应。否则,适配MC。
这个很好理解,BM输入有
x
n
(
k
)
\mathbf{x}_{n}(k)
xn(k)和
b
(
k
)
\mathbf{b}(k)
b(k),要和目标信号结合进行BM自适应,所以BM中的自适应滤波器仅在有目标信号时自适应。MC是为了消除噪声,反馈是
y
(
k
)
y(k)
y(k),所以仅在无目标信号时自适应MC滤波器。很合理,没毛病。
本书5.5讲例子,采用CCAF-NCAF结构的GJBF结合AMC (GJBFCNA)在计算机模拟的消声环境和真实混响环境中进行了评估。在消声环境下,将其与传统波束形成器在灵敏度模式上进行了比较。在真实混响环境中,采用SIR法进行客观评价,采用平均意见评分法进行主观评价。之后有机会再写。