《Estimating two-dimensional frequencies by matrix enhancement and matrix pencil》1
文章目录
问题概述
2D频率估计问题
从多径2D频率信号的 ∑ \sum{} ∑和式中分离出所有的频率分量的问题。
我们考虑一个无噪的二维频率
数据域的2D-sample结构表达式——
x
(
m
;
n
)
=
∑
i
=
1
I
r
i
exp
(
j
ϕ
i
+
j
2
π
f
1
i
m
+
j
2
π
f
2
i
n
)
(
1
)
x\left( m;n \right) =\sum_{i=1}^I{r_i\exp \left( j\phi _i+j2\pi f_{1i}m+j2\pi f_{2i}n \right)}\,\, \left( 1 \right)
x(m;n)=i=1∑Iriexp(jϕi+j2πf1im+j2πf2in)(1)
其中,
0
⩽
m
⩽
M
,
0
⩽
n
⩽
N
.
0\leqslant m\leqslant M, 0\leqslant n\leqslant N.
0⩽m⩽M,0⩽n⩽N.
(1)表明2D频率的数据由I
个多径的2D-frequencies参数:
{
(
f
1
i
,
f
2
i
)
;
i
=
1
,
⋯
,
I
}
,
{
r
i
:
i
=
1
,
⋯
,
I
}
,
{
ϕ
i
;
i
=
1
,
⋯
,
I
}
\left\{ \left( f_{1i},f_{2i} \right) ;i=1,\cdots ,I \right\} ,\left\{ r_i:i=1,\cdots ,I \right\} ,\left\{ \phi _i;i=1,\cdots ,I \right\}
{(f1i,f2i);i=1,⋯,I},{ri:i=1,⋯,I},{ϕi;i=1,⋯,I}
分别为(非零的)模值、频率和相位。这些参数需要被估计。
在噪声系统中——
x
′
(
m
;
n
)
=
x
(
m
;
n
)
+
w
(
m
;
n
)
x^{\prime}\left( m;n \right) =x\left( m;n \right) +w\left( m;n \right) \,\,
x′(m;n)=x(m;n)+w(m;n)
其中 w ( m ; n ) w\left( m;n \right) w(m;n)为2D的噪声序列(实际系统往往存在噪声)。
从式子(1)来看, r i , ϕ i r_i,\phi _i ri,ϕi可以很容易得到一旦 { ( f 1 i , f 2 i ) ; i = 1 , ⋯ , I } \left\{ \left( f_{1i},f_{2i} \right) ;i=1,\cdots ,I \right\} {(f1i,f2i);i=1,⋯,I}被精确估计之后因为根据指数乘法的性质 r i exp ( j ϕ i ) r_i\exp \left( j\phi _i \right) riexp(jϕi)可以被线性地抽离出来。
问题的矩阵分解和简化
以exp
为最小粒度重写式子(1),可以得到——
x
(
m
;
n
)
=
∑
i
=
1
I
a
i
y
i
m
z
i
n
(
2
)
x\left( m;n \right) =\sum_{i=1}^I{a_iy_{i}^{m}z_{i}^{n}\,\, \left( 2 \right)}
x(m;n)=i=1∑Iaiyimzin(2)
其中
{
y
i
=
exp
(
j
2
π
f
1
i
)
(
3
)
z
i
=
exp
(
j
2
π
f
2
i
)
(
4
)
a
i
=
r
i
exp
(
j
ϕ
i
)
(
5
)
。
\left\{ \begin{array}{c} y_i=\exp \left( j2\pi f_{1i} \right)(3)\\ z_i=\exp \left( j2\pi f_{2i} \right)(4)\\ a_i=r_i\exp \left( j\phi _i \right)(5)\\ \end{array} \right.。
⎩
⎨
⎧yi=exp(j2πf1i)(3)zi=exp(j2πf2i)(4)ai=riexp(jϕi)(5)。对
y
i
y_i
yi和
z
i
z_i
zi的估计就对
f
1
i
f_{1i}
f1i和
f
2
i
f_{2i}
f2i的估计。
已知的抽样信号矩阵的形式如下——
X
=
[
x
(
0
;
0
)
x
(
0
;
1
)
⋯
x
(
0
;
N
−
1
)
x
(
1
;
0
)
x
(
1
;
1
)
⋯
x
(
1
;
N
−
1
)
⋮
⋮
⋯
⋮
x
(
M
−
1
;
0
)
x
(
M
−
1
;
1
)
⋯
x
(
M
−
1
;
N
−
1
)
]
(
6
)
\boldsymbol{X}=\left[ \begin{matrix} \,\,x\left( 0;0 \right)& \,\,x\left( 0;1 \right)& \cdots& x\left( 0;N-1 \right)\\ \,\,x\left( 1;0 \right)& \,\,x\left( 1;1 \right)& \cdots& x\left( 1;N-1 \right)\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ x\left( M-1;0 \right)& x\left( M-1;1 \right)& \cdots& x\left( M-1;N-1 \right)\\ \end{matrix} \right] \,\, \left( 6 \right)
X=
x(0;0)x(1;0)⋮x(M−1;0)x(0;1)x(1;1)⋮x(M−1;1)⋯⋯⋯⋯x(0;N−1)x(1;N−1)⋮x(M−1;N−1)
(6)
由(3)在(7)的形式中可以得到——
X
=
Y
A
Z
(
7
)
Y
=
[
1
1
⋯
1
y
1
y
2
⋯
y
I
⋮
⋮
⋯
⋮
y
1
M
−
1
y
2
M
−
1
⋯
y
I
M
−
1
]
(
8
)
A
=
d
i
a
g
[
a
1
,
a
2
,
⋯
,
a
I
]
(
9
)
Z
=
[
1
z
1
⋯
z
1
N
−
1
1
z
2
⋯
z
2
N
−
1
⋮
⋮
⋯
⋮
1
z
I
⋯
z
I
N
−
1
]
(
10
)
\boldsymbol{X}=\boldsymbol{YAZ}\left( 7 \right) \\ \boldsymbol{Y}=\left[ \begin{matrix} \,\,1& \,\,1& \cdots& 1\\ \,y_1& \,\,y_2& \cdots& y_I\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ y_{1}^{M-1}& y_{2}^{M-1}& \cdots& y_{I}^{M-1}\\ \end{matrix} \right] \left( 8 \right) \\ \boldsymbol{A}=\mathrm{diag}\left[ a_1,a_2,\cdots ,a_I \right] \left( 9 \right) \\ \boldsymbol{Z}=\left[ \begin{matrix} \,\,1& \,\,z_1& \cdots& z_{1}^{N-1}\\ \,1& \,\,z_2& \cdots& z_{2}^{N-1}\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ 1& z_I& \cdots& z_{I\,\,}^{N-1}\\ \end{matrix} \right] \left( 10 \right)
X=YAZ(7)Y=
1y1⋮y1M−11y2⋮y2M−1⋯⋯⋯⋯1yI⋮yIM−1
(8)A=diag[a1,a2,⋯,aI](9)Z=
11⋮1z1z2⋮zI⋯⋯⋯⋯z1N−1z2N−1⋮zIN−1
(10)
(这种二维形式的矩阵分解和乘法形式是常见的可以记住。)
具体的推导过程:
X M × N = [ 1 1 ⋯ 1 y 1 y 2 ⋯ y I ⋮ ⋮ ⋯ ⋮ y 1 M − 1 y 2 M − 1 ⋯ y I M − 1 ] M × I [ a 1 0 ⋯ 0 0 a 2 ⋯ 0 ⋮ ⋮ ⋯ ⋮ 0 0 ⋯ a I ] ⏟ I × I [ 1 z 1 ⋯ z 1 N − 1 1 z 2 ⋯ z 2 N − 1 ⋮ ⋮ ⋯ ⋮ 1 z I ⋯ z I N − 1 ] I × N = [ a 1 y 1 0 a 2 y 2 0 ⋯ a I y I 0 a 1 y 1 1 a 2 y 2 1 ⋯ a I y I 1 ⋮ ⋮ ⋯ ⋮ a 1 y 1 M − 1 a 2 y 2 M − 1 ⋯ a I y I M − 1 ] [ z 1 0 z 1 ⋯ z 1 N − 1 z 2 0 z 2 ⋯ z 2 N − 1 ⋮ ⋮ ⋯ ⋮ z I 0 z I ⋯ z I N − 1 ] = [ ∑ i = 1 I a i y i 0 z i 0 ∑ i = 1 I a i y i 0 z i 1 ⋯ ∑ i = 1 I a i y i 0 z i N − 1 ∑ i = 1 I a i y i 1 z i 0 ∑ i = 1 I a i y i 1 z i 1 ⋯ ∑ i = 1 I a i y i 1 z i N − 1 ⋮ ⋮ ⋯ ⋮ ∑ i = 1 I a i y i M − 1 z i 0 ∑ i = 1 I a i y i M − 1 z i 1 ⋯ ∑ i = 1 I a i y i M − 1 z i N − 1 ] = [ x ( 0 ; 0 ) x ( 0 ; 1 ) ⋯ x ( 0 ; N − 1 ) x ( 1 ; 0 ) x ( 1 ; 1 ) ⋯ x ( 1 ; N − 1 ) ⋮ ⋮ ⋯ ⋮ x ( M − 1 ; 0 ) x ( M − 1 ; 1 ) ⋯ x ( M − 1 ; N − 1 ) ] 证毕 . \boldsymbol{X}_{M\times N}=\underbrace{\left[ \begin{matrix} \,\,1& \,\,1& \cdots& 1\\ \,y_1& \,\,y_2& \cdots& y_I\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ y_{1}^{M-1}& y_{2}^{M-1}& \cdots& y_{I}^{M-1}\\ \end{matrix} \right] _{M\times I}\left[ \begin{matrix} \,\,a_1& \,\,0& \cdots& 0\\ \,0& \,\,a_2& \cdots& 0\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ 0& 0& \cdots& a_I\\ \end{matrix} \right] }_{I\times I}\left[ \begin{matrix} \,\,1& \,\,z_1& \cdots& z_{1}^{N-1}\\ \,1& \,\,z_2& \cdots& z_{2}^{N-1}\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ 1& z_I& \cdots& z_{I\,\,}^{N-1}\\ \end{matrix} \right] _{I\times N} \\ =\left[ \begin{matrix} \,\,a_1y_{1}^{0}& a_2y_{2}^{0}\,\,& \cdots& a_Iy_{I}^{0}\\ \,a_1y_{1}^{1}& \,\,a_2y_{2}^{1}& \cdots& a_Iy_{I}^{1}\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ a_1y_{1}^{M-1}& a_2y_{2}^{M-1}& \cdots& a_Iy_{I}^{M-1}\\ \end{matrix} \right] \left[ \begin{matrix} \,\,z_{1}^{0}& \,\,z_1& \cdots& z_{1}^{N-1}\\ \,z_{2}^{0}& \,\,z_2& \cdots& z_{2}^{N-1}\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ z_{I}^{0}& z_I& \cdots& z_{I\,\,}^{N-1}\\ \end{matrix} \right] \\ =\left[ \begin{matrix} \,\,\sum_{i=1}^I{a_iy_{i}^{0}}z_{i}^{0}& \sum_{i=1}^I{a_iy_{i}^{0}}z_{i}^{1}\,\,& \cdots& \sum_{i=1}^I{a_iy_{i}^{0}}z_{i}^{N-1}\\ \,\sum_{i=1}^I{a_iy_{i}^{1}}z_{i}^{0}& \,\sum_{i=1}^I{a_iy_{i}^{1}}z_{i}^{1}& \cdots& \sum_{i=1}^I{a_iy_{i}^{1}}z_{i}^{N-1}\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ \sum_{i=1}^I{a_iy_{i}^{M-1}}z_{i}^{0}& \sum_{i=1}^I{a_iy_{i}^{M-1}}z_{i}^{1}& \cdots& \sum_{i=1}^I{a_iy_{i}^{M-1}}z_{i}^{N-1}\\ \end{matrix} \right] \\ =\left[ \begin{matrix} \,\,x\left( 0;0 \right)& \,\,x\left( 0;1 \right)& \cdots& x\left( 0;N-1 \right)\\ \,\,x\left( 1;0 \right)& \,\,x\left( 1;1 \right)& \cdots& x\left( 1;N-1 \right)\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ x\left( M-1;0 \right)& x\left( M-1;1 \right)& \cdots& x\left( M-1;N-1 \right)\\ \end{matrix} \right] \text{证毕}. XM×N=I×I 1y1⋮y1M−11y2⋮y2M−1⋯⋯⋯⋯1yI⋮yIM−1 M×I a10⋮00a2⋮0⋯⋯⋯⋯00⋮aI 11⋮1z1z2⋮zI⋯⋯⋯⋯z1N−1z2N−1⋮zIN−1 I×N= a1y10a1y11⋮a1y1M−1a2y20a2y21⋮a2y2M−1⋯⋯⋯⋯aIyI0aIyI1⋮aIyIM−1 z10z20⋮zI0z1z2⋮zI⋯⋯⋯⋯z1N−1z2N−1⋮zIN−1 = ∑i=1Iaiyi0zi0∑i=1Iaiyi1zi0⋮∑i=1IaiyiM−1zi0∑i=1Iaiyi0zi1∑i=1Iaiyi1zi1⋮∑i=1IaiyiM−1zi1⋯⋯⋯⋯∑i=1Iaiyi0ziN−1∑i=1Iaiyi1ziN−1⋮∑i=1IaiyiM−1ziN−1 = x(0;0)x(1;0)⋮x(M−1;0)x(0;1)x(1;1)⋮x(M−1;1)⋯⋯⋯⋯x(0;N−1)x(1;N−1)⋮x(M−1;N−1) 证毕.
·顺便复习一下考研中关于矩阵乘法 A m × n B n × p = C m × p A_{m\times n}B_{n\times p}=C_{m\times p} Am×nBn×p=Cm×p的行列分块和秩的结论。
对 A A A做列分块,于是有
[ r 1 , ⋯ , r n ] [ b 11 ⋯ b 1 p ⋮ ⋮ ⋮ b n 1 ⋯ b n p ] = [ c 1 , ⋯ , c p ] { b 11 r 1 + b 21 r 2 + ⋯ + b n 1 r n = c 1 ⋮ b 1 i r 1 + b 2 i r 2 + ⋯ + b n i r n = c i ⋮ b 1 p r 1 + b 2 p r 2 + ⋯ + b n p r n = c p \left[ \boldsymbol{r}_1,\cdots ,\boldsymbol{r}_n \right] \left[ \begin{matrix} b_{11}& \cdots& b_{1p}\\ \vdots& \vdots& \vdots\\ b_{n1}& \cdots& b_{np}\\ \end{matrix} \right] =\left[ \boldsymbol{c}_1,\cdots ,\boldsymbol{c}_p \right] \\ \left\{ \begin{array}{c} b_{11}\boldsymbol{r}_1+b_{21}\boldsymbol{r}_2+\cdots +b_{n1}\boldsymbol{r}_n=\boldsymbol{c}_1\\ \vdots\\ b_{1i}\boldsymbol{r}_1+b_{2i}\boldsymbol{r}_2+\cdots +b_{ni}\boldsymbol{r}_n=\boldsymbol{c}_i\\ \vdots\\ b_{1p}\boldsymbol{r}_1+b_{2p}\boldsymbol{r}_2+\cdots +b_{np}\boldsymbol{r}_n=\boldsymbol{c}_p\\ \end{array} \right. [r1,⋯,rn] b11⋮bn1⋯⋮⋯b1p⋮bnp =[c1,⋯,cp]⎩ ⎨ ⎧b11r1+b21r2+⋯+bn1rn=c1⋮b1ir1+b2ir2+⋯+bnirn=ci⋮b1pr1+b2pr2+⋯+bnprn=cp
C = A B C=AB C=AB的列向量可以由 A A A的列向量线性表出。同时表明如果 A A A列满秩, r ( A B ) = r ( B ) r(AB)=r(B) r(AB)=r(B)。即左乘列满秩矩阵秩不变。
对 B B B做行分块,于是有
[ a 11 ⋯ a 1 n ⋮ ⋮ ⋮ a m 1 ⋯ a m n ] [ b 1 ⋮ b n ] = [ c 1 ⋮ c m ] { a 11 b 1 + a 12 b 2 + ⋯ + a 1 n b n = c 1 ⋮ a i 1 b 1 + a i 2 b 2 + ⋯ + a i n b n = c i ⋮ a m 1 b 1 + a m 2 b 2 + ⋯ + a m n b n = c m \left[ \begin{matrix} a_{11}& \cdots& a_{1n}\\ \vdots& \vdots& \vdots\\ a_{m1}& \cdots& a_{mn}\\ \end{matrix} \right] \left[ \begin{array}{c} \boldsymbol{b}_1\\ \vdots\\ \boldsymbol{b}_n\\ \end{array} \right] =\left[ \begin{array}{c} c_1\\ \vdots\\ c_m\\ \end{array} \right] \\ \left\{ \begin{array}{c} a_{11}\boldsymbol{b}_1+a_{12}\boldsymbol{b}_2+\cdots +a_{1n}\boldsymbol{b}_n=\boldsymbol{c}_1\\ \vdots\\ a_{i1}\boldsymbol{b}_1+a_{i2}\boldsymbol{b}_2+\cdots +a_{in}\boldsymbol{b}_n=\boldsymbol{c}_i\\ \vdots\\ a_{m1}\boldsymbol{b}_1+a_{m2}\boldsymbol{b}_2+\cdots +a_{mn}\boldsymbol{b}_n=\boldsymbol{c}_m\\ \end{array} \right. a11⋮am1⋯⋮⋯a1n⋮amn b1⋮bn = c1⋮cm ⎩ ⎨ ⎧a11b1+a12b2+⋯+a1nbn=c1⋮ai1b1+ai2b2+⋯+ainbn=ci⋮am1b1+am2b2+⋯+amnbn=cm
C = A B C=AB C=AB的行向量可以由 B B B的列向量线性表出。同时表明如果 B B B行满秩, r ( A B ) = r ( A ) r(AB)=r(A) r(AB)=r(A)。即右乘行满秩矩阵秩不变。
同时表明,对于式子(3)矩阵 X m , n = ∑ i = 1 I a i y i m z i n X_{m,n}=\sum_{i=1}^I{a_iy_{i}^{m}z_{i}^{n}} Xm,n=∑i=1Iaiyimzin来说, z i n z_{i}^{n} zin 是来自于(10)中 Z Z Z的第 n n n列的贡献, y i m y_{i}^{m} yim 是来自于(10)中 Y Y Y的第 m m m行的贡献,对角矩阵 A A A则是将相应的 y i m y_{i}^{m} yim和 z i n z_{i}^{n} zin c o n c a t concat concat起来,于是上面式子的由来被完整地梳理了一遍。
式子(7)
⟶
\longrightarrow
⟶
r
(
Y
A
Z
)
≪
r
(
A
)
=
I
r\left( YAZ \right) \ll r\left( A \right) =I
r(YAZ)≪r(A)=I ,等号当且仅当
Y
Y
Y列满秩、
Z
Z
Z行满秩且
M
⩾
I
,
N
⩾
I
M\geqslant I, N\geqslant I
M⩾I,N⩾I. 观察到
Y
Y
Y和
Z
Z
Z矩阵的
V
a
n
d
e
r
M
o
n
d
e
VanderMonde
VanderMonde形式,上述条件可以被恒等转化为
{
y
i
;
i
=
1
,
⋯
,
I
}
\left\{ y_i;i=1,\cdots ,I \right\}
{yi;i=1,⋯,I}和
{
z
i
;
i
=
1
,
⋯
,
I
}
\left\{ z_i;i=1,\cdots ,I \right\}
{zi;i=1,⋯,I}都不包含重复值否则对于
r
(
X
)
=
I
r(X)=I
r(X)=I这个条件的推理的不够充分的(是一种病态条件)。ps:原文中作者认为只要2D频率对
{
{
y
i
,
z
i
}
;
i
=
1
,
⋯
,
I
}
\left\{ \left\{ y_i,z_i \right\} ;i=1,\cdots ,I \right\}
{{yi,zi};i=1,⋯,I}的每组的独立的就ok,也就是允许
y
y
y和
z
z
z的单独频率可以重复但需要错开,我认为这种方法不能够保证Y和Z的满秩条件,在仿真的实验中也验证了
y
y
y和
z
z
z都需要分别包含不重复值这一结论,评论区有对这个问题思考的可以一起交流!
(update:这里后来重新理解了一下就是式子(7)要使
X
X
X秩为
I
I
I确实要y和z都不包含相同值,但是从后面增强矩阵式子(25)可以看出只要yz对没有重复值就可以很好地恢复,所以在这个意义上 这种增强强化了MEMP算法的使用范畴比较2D对重复的可能性比1D频率重复的可能性小得多。)
一、算法推导与展开
matrix enhancement
增强型矩阵 X e \boldsymbol{X}_e Xe
通过矩阵的分隔和合并来构造增强后的Hankle-block矩阵(每一条副对角线上的元素都相等)
X
e
=
[
X
0
X
1
⋯
X
M
−
K
X
1
X
2
⋯
X
M
−
K
+
1
⋮
⋮
⋯
⋮
X
K
−
1
X
K
⋯
X
M
−
1
]
K
L
×
(
M
−
K
+
1
)
(
N
−
L
+
1
)
(
11
)
\boldsymbol{X}_e=\left[ \begin{matrix} \boldsymbol{X}_0& \boldsymbol{X}_1& \cdots& \boldsymbol{X}_{M-K}\\ \boldsymbol{X}_1& \boldsymbol{X}_2& \cdots& \boldsymbol{X}_{M-K+1}\\ \vdots& \vdots& \cdots& \vdots\\ \boldsymbol{X}_{K-1}& \boldsymbol{X}_K& \cdots& \boldsymbol{X}_{M-1}\\ \end{matrix} \right] _{KL\times \left( M-K+1 \right) \left( N-L+1 \right)}\left( 11 \right)
Xe=
X0X1⋮XK−1X1X2⋮XK⋯⋯⋯⋯XM−KXM−K+1⋮XM−1
KL×(M−K+1)(N−L+1)(11)
其中——
X
m
=
[
x
(
m
;
0
)
x
(
m
;
1
)
⋯
x
(
m
;
N
−
L
)
x
(
m
;
1
)
x
(
m
;
2
)
⋯
x
(
m
;
N
−
L
+
1
)
⋮
⋮
⋯
⋮
x
(
m
;
L
−
1
)
x
(
m
;
L
)
⋯
x
(
m
;
N
−
1
)
]
L
×
(
N
−
L
+
1
)
(
12
)
\boldsymbol{X}_m=\left[ \begin{matrix} x\left( m;0 \right)& x\left( m;1 \right)& \cdots& x\left( m;N-L \right)\\ x\left( m;1 \right)& x\left( m;2 \right)& \cdots& x\left( m;N-L+1 \right)\\ \vdots& \vdots& \cdots& \vdots\\ x\left( m;L-1 \right)& x\left( m;L \right)& \cdots& x\left( m;N-1 \right)\\ \end{matrix} \right] _{L\times \left( N-L+1 \right)}\left( 12 \right)
Xm=
x(m;0)x(m;1)⋮x(m;L−1)x(m;1)x(m;2)⋮x(m;L)⋯⋯⋯⋯x(m;N−L)x(m;N−L+1)⋮x(m;N−1)
L×(N−L+1)(12)
X
m
\boldsymbol{X}_m
Xm是给定
m
m
m之后对
x
(
m
;
0
)
⟶
x
(
m
;
N
−
1
)
x\left( m;0 \right) \longrightarrow x\left( m;N-1 \right)
x(m;0)⟶x(m;N−1)以
L
L
L为长度做滑动的矩阵。
X
e
\boldsymbol{X}_e
Xe是
m
m
m取值在
0
⟶
M
−
1
0\longrightarrow M-1
0⟶M−1之间的以
K
K
K为长度做滑动的
X
m
\boldsymbol{X}_m
Xm。
式子(2)带入(12),
X
m
=
Z
L
A
Y
d
m
Z
R
(
13
)
Z
L
=
[
z
1
0
z
2
0
⋯
z
I
0
z
1
z
2
⋯
z
I
⋮
⋮
⋯
⋮
z
1
L
−
1
z
2
L
−
1
⋯
z
I
L
−
1
]
L
×
I
(
14
)
Y
d
=
d
i
a
g
[
y
1
,
y
2
,
⋯
,
y
I
]
(
15
)
Z
R
=
[
z
1
0
z
1
⋯
z
1
N
−
L
z
2
0
z
2
⋯
z
2
N
−
L
⋮
⋮
⋯
⋮
z
I
0
z
I
⋯
z
I
N
−
L
]
I
×
N
−
L
+
1
(
16
)
\boldsymbol{X}_m=\boldsymbol{Z}_L\boldsymbol{AY}_{d}^{m}\boldsymbol{Z}_R\left( 13 \right) \\ \boldsymbol{Z}_L=\left[ \begin{matrix} \,\,z_{1}^{0}& \,\,z_{2}^{0}& \cdots& z_{I}^{0}\\ \,z_1& \,\,z_2& \cdots& z_I\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ z_{1}^{L-1}& z_{2}^{L-1}& \cdots& z_{I\,\,}^{L-1}\\ \end{matrix} \right] _{L\times I}\left( 14 \right) \\ \boldsymbol{Y}_d=\mathrm{diag}\left[ y_1,y_2,\cdots ,y_I \right] \left( 15 \right) \\ \boldsymbol{Z}_R=\left[ \begin{matrix} \,\,z_{1}^{0}& \,\,z_1& \cdots& z_{1}^{N-L}\\ \,z_{2}^{0}& \,\,z_2& \cdots& z_{2}^{N-L}\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ z_{I}^{0}& z_I& \cdots& z_{I\,\,}^{N-L}\\ \end{matrix} \right] _{I\times N-L+1}\left( 16 \right)
Xm=ZLAYdmZR(13)ZL=
z10z1⋮z1L−1z20z2⋮z2L−1⋯⋯⋯⋯zI0zI⋮zIL−1
L×I(14)Yd=diag[y1,y2,⋯,yI](15)ZR=
z10z20⋮zI0z1z2⋮zI⋯⋯⋯⋯z1N−Lz2N−L⋮zIN−L
I×N−L+1(16)
式子(13)的由来和(7)类似,对于式子(12)的矩阵
X
m
(
p
q
)
=
x
(
m
;
p
+
q
)
=
∑
i
=
1
I
a
i
y
i
m
z
i
p
+
q
{\boldsymbol{X}_m}_{\left( pq \right)}=x\left( m;p+q \right) =\sum_{i=1}^I{a_iy_{i}^{m}z_{i}^{p+q}}
Xm(pq)=x(m;p+q)=∑i=1Iaiyimzip+q, 其中
p
,
q
p,q
p,q从0开始索引,
a
i
y
i
m
a_iy_{i}^{m}
aiyim由两个对角矩阵的乘积
A
Y
d
m
\boldsymbol{AY}_{d}^{m}
AYdm贡献,
z
i
p
+
q
z_{i}^{p+q}
zip+q由第
p
p
p行的
Z
L
\boldsymbol{Z}_L
ZL和第
q
q
q列的
Z
R
\boldsymbol{Z}_R
ZR的内积贡献,以上思路同式子(7)的由来。
将(13)带入(11),
X
e
=
E
L
A
E
R
(
17
)
E
L
=
[
Z
L
Z
L
Y
d
⋯
Z
L
Y
d
K
−
1
]
K
L
×
I
(
18
)
E
R
=
[
Z
R
,
Y
d
Z
R
,
⋯
,
Y
d
M
−
K
Z
R
]
I
×
(
N
−
L
+
1
)
(
M
−
K
+
1
)
(
19
)
\boldsymbol{X}_e=\boldsymbol{E}_L\boldsymbol{AE}_R\left( 17 \right) \\ \boldsymbol{E}_L=\left[ \begin{array}{l} \boldsymbol{Z}_L\\ \boldsymbol{Z}_L\boldsymbol{Y}_d\\ \cdots\\ \boldsymbol{Z}_L\boldsymbol{Y}_{d}^{K-1}\\ \end{array} \right] _{KL\times I}\left( 18 \right) \\ \boldsymbol{E}_R=\left[ \boldsymbol{Z}_R,\boldsymbol{Y}_d\boldsymbol{Z}_R,\cdots ,\boldsymbol{Y}_{d}^{M-K}\boldsymbol{Z}_R \right] _{I\times \left( N-L+1 \right) \left( M-K+1 \right)}\left( 19 \right)
Xe=ELAER(17)EL=
ZLZLYd⋯ZLYdK−1
KL×I(18)ER=[ZR,YdZR,⋯,YdM−KZR]I×(N−L+1)(M−K+1)(19)
式子(17)的由来还是类似上面,
X
e
(
p
q
)
=
X
p
+
q
−
2
=
Z
L
A
Y
d
p
+
q
−
2
Z
R
=
Z
L
Y
d
p
−
1
A
Y
d
q
−
1
Z
R
=
E
L
(
p
,
:
)
⋅
A
⋅
E
R
(
:
,
q
)
(
20
)
{\boldsymbol{X}_e}_{\left( pq \right)}=\boldsymbol{X}_{p+q-2}=\boldsymbol{Z}_L\boldsymbol{AY}_{d}^{p+q-2}\boldsymbol{Z}_R=\boldsymbol{Z}_L\boldsymbol{Y}_{d}^{p-1}\boldsymbol{AY}_{d}^{q-1}\boldsymbol{Z}_R=\boldsymbol{E}_L\left( p,: \right) \cdot \boldsymbol{A}\cdot \boldsymbol{E}_R\left( :,q \right) \left( 20 \right)
Xe(pq)=Xp+q−2=ZLAYdp+q−2ZR=ZLYdp−1AYdq−1ZR=EL(p,:)⋅A⋅ER(:,q)(20)
式子(17)表明增强后的矩阵
X
e
\boldsymbol{X}_e
Xe满足
r
(
X
e
)
=
I
⇔
r
(
E
L
)
=
r
(
E
R
)
=
I
r\left( \boldsymbol{X}_e \right) =I\Leftrightarrow r\left( \boldsymbol{E}_L \right) =r\left( \boldsymbol{E}_R \right) =I
r(Xe)=I⇔r(EL)=r(ER)=I
K K K和 L L L满足的条件
T h e o r m 1 : r ( E L ) = I ⇔ K ⩾ I a n d L ≫ I . Theorm1: r\left( \boldsymbol{E}_L \right) =I\Leftrightarrow K\geqslant I\,\,and\,\,L\gg I. Theorm1:r(EL)=I⇔K⩾IandL≫I.
原文中引入了一个shuffle重拍列矩阵
P = [ p T ( 1 ) p T ( 1 + L ) ⋯ p T ( 1 + ( K − 1 ) L ) p T ( 2 ) p T ( 2 + L ) ⋯ p T ( 2 + ( K − 1 ) L ) ⋯ ⋯ p T ( L ) p T ( L + L ) ⋯ p T ( L + ( K − 1 ) L ) ] K L × K L ( 21 ) \boldsymbol{P}=\left[ \begin{array}{c} \begin{array}{c} \boldsymbol{p}^T\left( 1 \right)\\ \boldsymbol{p}^T\left( 1+L \right)\\ \cdots\\ \boldsymbol{p}^T\left( 1+\left( K-1 \right) L \right)\\ \end{array}\\ \begin{array}{c} \boldsymbol{p}^T\left( 2 \right)\\ \boldsymbol{p}^T\left( 2+L \right)\\ \cdots\\ \boldsymbol{p}^T\left( 2+\left( K-1 \right) L \right)\\ \cdots\\ \cdots\\ \begin{array}{c} \boldsymbol{p}^T\left( L \right)\\ \boldsymbol{p}^T\left( L+L \right)\\ \cdots\\ \boldsymbol{p}^T\left( L+\left( K-1 \right) L \right)\\ \end{array}\\ \end{array}\\ \end{array} \right] _{KL\times KL} \left( 21 \right) P= pT(1)pT(1+L)⋯pT(1+(K−1)L)pT(2)pT(2+L)⋯pT(2+(K−1)L)⋯⋯pT(L)pT(L+L)⋯pT(L+(K−1)L) KL×KL(21)
其中 p ( i ) \boldsymbol{p}\left( i \right) p(i)表示一个长度为 K L KL KL的列向量,其中位置是 i i i为1,其余为0,易得
E L P = P E L ( 22 ) E L P = [ Y L Y L Z d ⋯ Y L Z d L − 1 ] K L × I ( 23 ) Y L = [ 1 1 ⋯ 1 y 1 y 2 ⋯ y I ⋮ ⋮ ⋯ ⋮ y 1 L − 1 y 2 L − 1 ⋯ y I L − 1 ] L × I ( 24 ) Z d = d i a g ( z 1 , z 2 , ⋯ , z I ) ( 25 ) \boldsymbol{E}_{LP}=\boldsymbol{PE}_L \left( 22 \right) \\ \boldsymbol{E}_{LP}=\left[ \begin{array}{c} \boldsymbol{Y}_L\\ \boldsymbol{Y}_L\boldsymbol{Z}_d\\ \cdots\\ \boldsymbol{Y}_L\boldsymbol{Z}_{d}^{L-1}\\ \end{array} \right] _{KL\times I} \left( 23 \right) \\ \boldsymbol{Y}_L=\left[ \begin{matrix} \,\,1& \,\,1& \cdots& 1\\ \,y_1& \,\,y_2& \cdots& y_I\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ y_{1}^{L-1}& y_{2}^{L-1}& \cdots& y_{I}^{L-1}\\ \end{matrix} \right] _{L\times I} \left( 24 \right) \\ \boldsymbol{Z}_d=\mathrm{diag}\left( z_1,z_2,\cdots ,z_I \right) \left( 25 \right) ELP=PEL(22)ELP= YLYLZd⋯YLZdL−1 KL×I(23)YL= 1y1⋮y1L−11y2⋮y2L−1⋯⋯⋯⋯1yI⋮yIL−1 L×I(24)Zd=diag(z1,z2,⋯,zI)(25)
P \boldsymbol{P} P的作用就是交换 E L \boldsymbol{E}_L EL中y和z的位置,即 y i y_i yi在 E L \boldsymbol{E}_L EL的位置相当于 z i z_i zi在 E L P \boldsymbol{E}_{LP} ELP. 这种重拍变换的逻辑在于在 E L \boldsymbol{E}_L EL的矩阵结构中——
f o r E L = [ Z L Z L Y d ⋯ Z L Y d L − 1 ] K L × I = [ [ y 1 0 y 2 0 ⋯ y I 0 z 1 y 1 0 z 2 y 2 0 ⋯ z I y I 0 ⋮ ⋮ ⋮ ⋮ z 1 L − 1 y 1 0 z 2 L − 1 y 2 0 ⋯ z I L − 1 y I 0 ] [ y 1 1 y 2 1 ⋯ y I 1 z 1 y 1 1 z 2 y 2 1 ⋯ z I y I 1 ⋮ ⋮ ⋮ ⋮ z 1 L − 1 y 1 1 z 2 L − 1 y 2 1 ⋯ z I L − 1 y I 1 ] ⋯ [ y 1 K − 1 y 2 K − 1 ⋯ y I K − 1 z 1 y 1 K − 1 z 2 y 2 K − 1 ⋯ z I y I K − 1 ⋮ ⋮ ⋮ ⋮ z 1 L − 1 y 1 K − 1 z 2 L − 1 y 2 K − 1 ⋯ z I L − 1 y I K − 1 ] ] ( 25 ) for\,\,\boldsymbol{E}_L=\left[ \begin{array}{l} \boldsymbol{Z}_L\\ \boldsymbol{Z}_L\boldsymbol{Y}_d\\ \cdots\\ \boldsymbol{Z}_L\boldsymbol{Y}_{d}^{L-1}\\ \end{array} \right] _{KL\times I}=\left[ \begin{array}{l} \left[ \begin{matrix} y_{1}^{0}& y_{2}^{0}& \cdots& y_{I}^{0}\\ z_1y_{1}^{0}& z_2y_{2}^{0}& \cdots& z_Iy_{I}^{0}\\ \vdots& \vdots& \vdots& \vdots\\ z_{1}^{L-1}y_{1}^{0}& z_{2}^{L-1}y_{2}^{0}& \cdots& z_{I}^{L-1}y_{I}^{0}\\ \end{matrix} \right]\\ \left[ \begin{matrix} y_{1}^{1}& y_{2}^{1}& \cdots& y_{I}^{1}\\ z_1y_{1}^{1}& z_2y_{2}^{1}& \cdots& z_Iy_{I}^{1}\\ \vdots& \vdots& \vdots& \vdots\\ z_{1}^{L-1}y_{1}^{1}& z_{2}^{L-1}y_{2}^{1}& \cdots& z_{I}^{L-1}y_{I}^{1}\\ \end{matrix} \right]\\ \cdots\\ \left[ \begin{matrix} y_{1}^{K-1}& y_{2}^{K-1}& \cdots& y_{I}^{K-1}\\ z_1y_{1}^{K-1}& z_2y_{2}^{K-1}& \cdots& z_Iy_{I}^{K-1}\\ \vdots& \vdots& \vdots& \vdots\\ z_{1}^{L-1}y_{1}^{K-1}& z_{2}^{L-1}y_{2}^{K-1}& \cdots& z_{I}^{L-1}y_{I}^{K-1}\\ \end{matrix} \right]\\ \end{array} \right] \left( 25 \right) forEL= ZLZLYd⋯ZLYdL−1 KL×I= y10z1y10⋮z1L−1y10y20z2y20⋮z2L−1y20⋯⋯⋮⋯yI0zIyI0⋮zIL−1yI0 y11z1y11⋮z1L−1y11y21z2y21⋮z2L−1y21⋯⋯⋮⋯yI1zIyI1⋮zIL−1yI1 ⋯ y1K−1z1y1K−1⋮z1L−1y1K−1y2K−1z2y2K−1⋮z2L−1y2K−1⋯⋯⋮⋯yIK−1zIyIK−1⋮zIL−1yIK−1 (25)
相当于取每个矩阵的第一行拼接在一起,然后第二行,以此类推,相当于对行进行了重排。这样就把y和z的位置交换,同时也把K和L交换。
这样 Z L \boldsymbol{Z}_L ZL和 Y L \boldsymbol{Y}_L YL都是 E L \boldsymbol{E}_L EL的子矩阵,于是有
r ( E L ) ⩾ r [ Z L Y L ] = r [ [ z 1 0 z 2 0 ⋯ z I 0 z 1 z 2 ⋯ z I ⋮ ⋮ ⋯ ⋮ z 1 L − 1 z 2 L − 1 ⋯ z I L − 1 ] L × I [ y 1 0 y 2 0 ⋯ y I 0 y 1 y 2 ⋯ y I ⋮ ⋮ ⋯ ⋮ y 1 L − 1 y 2 L − 1 ⋯ y I L − 1 ] L × I ] ( 26 ) r\left( \boldsymbol{E}_L \right) \geqslant r\left[ \begin{array}{c} \boldsymbol{Z}_L\\ \boldsymbol{Y}_L\\ \end{array} \right] =r\left[ \begin{array}{c} \left[ \begin{matrix} \,\,z_{1}^{0}& \,\,z_{2}^{0}& \cdots& z_{I}^{0}\\ \,z_1& \,\,z_2& \cdots& z_I\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ z_{1}^{L-1}& z_{2}^{L-1}& \cdots& z_{I\,\,}^{L-1}\\ \end{matrix} \right] _{L\times I}\\ \left[ \begin{matrix} \,\,y_{1}^{0}& \,\,y_{2}^{0}& \cdots& y_{I}^{0}\\ \,y_1& \,\,y_2& \cdots& y_I\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ y_{1}^{L-1}& y_{2}^{L-1}& \cdots& y_{I}^{L-1}\\ \end{matrix} \right] _{L\times I}\\ \end{array} \right] \left( 26 \right) r(EL)⩾r[ZLYL]=r z10z1⋮z1L−1z20z2⋮z2L−1⋯⋯⋯⋯zI0zI⋮zIL−1 L×I y10y1⋮y1L−1y20y2⋮y2L−1⋯⋯⋯⋯yI0yI⋮yIL−1 L×I (26)
如果 { ( y i , z i ) ; i = 1 , 2 , ⋯ , I } i s d i s t i n c t \left\{ \left( y_i,z_i \right) ;i=1,2,\cdots ,I \right\} is\,\,distinct {(yi,zi);i=1,2,⋯,I}isdistinct. (26)矩阵列满秩
∴ \therefore ∴当 K ⩾ I a n d L ≫ I ⟶ r ( E L ) = I K\geqslant I\,\,and\,\,L\gg I \longrightarrow r\left( \boldsymbol{E}_L \right) =I K⩾IandL≫I⟶r(EL)=I.充分性得证。
关于必要性,由于 E L \boldsymbol{E}_L EL是 K L KL KL行 I I I列矩阵,所以 r ( E L ) = I r\left( \boldsymbol{E}_L \right) =I r(EL)=I必须有 K L ⩾ I KL\geqslant I KL⩾I,这个条件不够强,可能会失效,而充分条件是最严格的,即
K ⩾ I a n d L ≫ I ( 27 ) K L ≫ I ( 28 ) K\geqslant I\,\,and\,\,L\gg I\left( 27 \right) \\ KL\gg I\left( 28 \right) K⩾IandL≫I(27)KL≫I(28)
根据对称性可以得到 E R \boldsymbol{E}_R ER侧的结论,
( M − K + 1 ) ⩾ I a n d ( N − L + 1 ) ≫ I ( 29 ) ( M − K + 1 ) ( N − L + 1 ) ≫ I ( 30 ) (M-K+1)\geqslant I\,\,and\,\,(N-L+1)\gg I\left( 29 \right) \\ (M-K+1)(N-L+1)\gg I\left( 30 \right) (M−K+1)⩾Iand(N−L+1)≫I(29)(M−K+1)(N−L+1)≫I(30)
事实上, E L \boldsymbol{E}_L EL和 E R \boldsymbol{E}_R ER是行拼接和列拼接分别对应列满秩和行满秩的特征, E R \boldsymbol{E}_R ER侧的 P \boldsymbol{P} P矩阵是做列shuffle重排!
X e \boldsymbol{X}_e Xe的特征结构
我们考虑从
X
e
\boldsymbol{X}_e
Xe中提取2D的频率信息——
对
X
e
\boldsymbol{X}_e
Xe做SVD分解,得到
X
e
=
∑
i
=
1
min
σ
i
u
i
v
i
H
=
U
s
Σ
s
V
s
H
+
U
n
Σ
n
V
n
H
(
31
)
U
s
=
[
u
1
,
u
2
,
⋯
,
u
I
]
(
31.
a
)
Σ
s
=
d
i
a
g
[
σ
1
,
σ
2
,
⋯
,
σ
I
]
(
31.
b
)
V
s
=
[
v
1
,
v
2
,
⋯
,
v
I
]
(
31.
c
)
U
n
=
[
u
I
+
1
,
u
I
+
2
,
⋯
,
u
min
]
(
31.
d
)
Σ
n
=
d
i
a
g
[
σ
I
+
1
,
σ
I
+
2
,
⋯
,
σ
min
]
(
31.
e
)
V
n
=
[
v
I
+
1
,
v
I
+
2
,
⋯
,
v
min
]
(
31.
f
)
\boldsymbol{X}_e=\sum_{i=1}^{\min}{\sigma _i\boldsymbol{u}_i\boldsymbol{v}_{i}^{H}} =\boldsymbol{U}_s\varSigma _s\boldsymbol{V}_{s}^{H}+\boldsymbol{U}_n\varSigma _n\boldsymbol{V}_{n}^{H}\left( 31 \right) \\ \boldsymbol{U}_s=\left[ \boldsymbol{u}_1,\boldsymbol{u}_2,\cdots ,\boldsymbol{u}_I \right] \left( 31.a \right) \\ \varSigma _s=\mathrm{diag}\left[ \sigma _1,\sigma _2,\cdots ,\sigma _I \right] \left( 31.b \right) \\ \boldsymbol{V}_s=\left[ \boldsymbol{v}_1,\boldsymbol{v}_2,\cdots ,\boldsymbol{v}_I \right] \left( 31.c \right) \\ \boldsymbol{U}_n=\left[ \boldsymbol{u}_{I+1},\boldsymbol{u}_{I+2},\cdots ,\boldsymbol{u}_{\min} \right] \left( 31.d \right) \\ \varSigma _n=\mathrm{diag}\left[ \sigma _{I+1},\sigma _{I+2},\cdots ,\sigma _{\min} \right] \left( 31.e \right) \\ \boldsymbol{V}_n=\left[ \boldsymbol{v}_{I+1},\boldsymbol{v}_{I+2},\cdots ,\boldsymbol{v}_{\min} \right] \left( 31.f \right) \\
Xe=i=1∑minσiuiviH=UsΣsVsH+UnΣnVnH(31)Us=[u1,u2,⋯,uI](31.a)Σs=diag[σ1,σ2,⋯,σI](31.b)Vs=[v1,v2,⋯,vI](31.c)Un=[uI+1,uI+2,⋯,umin](31.d)Σn=diag[σI+1,σI+2,⋯,σmin](31.e)Vn=[vI+1,vI+2,⋯,vmin](31.f)
这里
σ
1
⩾
σ
2
⩾
⋯
⩾
σ
min
\sigma _1\geqslant \sigma _2\geqslant \cdots \geqslant \sigma _{\min}
σ1⩾σ2⩾⋯⩾σmin.对于无噪声的情况,只有
I
I
I个非零奇异值,而有噪声情况下,噪声带来的奇异值的扰动会和2D频率的奇异值相差较大从而可以分离出多径,从而预测
I
I
I。
由于
r
(
X
e
)
=
r
(
E
L
)
=
I
r\left( X_e \right) =r\left( E_L \right) =I
r(Xe)=r(EL)=I,所以
r
a
n
g
e
(
X
e
)
=
r
a
n
g
e
(
E
L
)
=
r
a
n
g
e
(
U
s
)
r
a
n
g
e
(
X
e
H
)
=
r
a
n
g
e
(
E
R
H
)
=
r
a
n
g
e
(
V
s
)
(
32
)
range\left( X_e \right) =range\left( E_L \right) =range\left( U_s \right) \\ range\left( X_{e}^{H} \right) =range\left( E_{R}^{H} \right) =range\left( V_s \right) \left( 32 \right)
range(Xe)=range(EL)=range(Us)range(XeH)=range(ERH)=range(Vs)(32)
这是因为式子(17)中
E
L
\boldsymbol{E}_L
EL列满秩,
E
R
\boldsymbol{E}_R
ER行满秩,所以SVD的
U
U
U矩阵的列空间和原矩阵的列空间一致,
V
V
V矩阵的行空间和原矩阵的行空间一致。
再次考虑(18)(25)中
E
L
\boldsymbol{E}_L
EL的结构,
E
L
\boldsymbol{E}_L
EL的第
i
i
i列可以被表示为
e
L
i
=
y
L
i
⊗
z
L
i
(
33
)
\boldsymbol{e}_{Li}=\boldsymbol{y}_{Li}\otimes \boldsymbol{z}_{Li} \left( 33 \right)
eLi=yLi⊗zLi(33)
其中
⊗
\otimes
⊗代表Kronecker product。
这代表
E
L
\boldsymbol{E}_L
EL的列向量可以和
y
i
y_i
yi和
z
i
z_i
zi的克罗内克积。式子(33)表明了
E
L
\boldsymbol{E}_L
EL、
y
L
\boldsymbol{y}_L
yL和
z
L
\boldsymbol{z}_L
zL之间的关系,
e
L
=
y
L
⊗
z
L
(
34
)
\boldsymbol{e}_L=\boldsymbol{y}_L\otimes \boldsymbol{z}_L\left( 34 \right)
eL=yL⊗zL(34)
其中,
y
L
=
[
1
,
y
,
⋯
,
y
K
−
1
]
T
(
35
)
z
L
=
[
1
,
z
,
⋯
,
z
L
−
1
]
T
(
36
)
y
=
exp
(
j
2
π
f
1
)
(
37
)
z
=
exp
(
j
2
π
f
2
)
(
38
)
\boldsymbol{y}_L=\left[ 1,y,\cdots ,y^{K-1} \right] ^T\left( 35 \right) \\ \boldsymbol{z}_L=\left[ 1,z,\cdots ,z^{L-1} \right] ^T\left( 36 \right) \\ y=\exp \left( j2\pi f_1 \right) \left( 37 \right) \\ z=\exp \left( j2\pi f_2 \right) \left( 38 \right)
yL=[1,y,⋯,yK−1]T(35)zL=[1,z,⋯,zL−1]T(36)y=exp(j2πf1)(37)z=exp(j2πf2)(38)
可以发现
e
L
∈
{
e
L
1
,
e
L
2
,
⋯
,
e
L
I
}
⇔
(
f
1
,
f
2
)
=
(
f
1
i
,
f
2
i
)
\boldsymbol{e}_L\in \left\{ \boldsymbol{e}_{L1},\boldsymbol{e}_{L2},\cdots ,\boldsymbol{e}_{LI} \right\} \Leftrightarrow \left( f_1,f_2 \right) =\left( f_{1i},f_{2i} \right)
eL∈{eL1,eL2,⋯,eLI}⇔(f1,f2)=(f1i,f2i)
因为(25)
E
L
\boldsymbol{E}_L
EL的结构天然地将对应的
y
i
y_i
yi和
z
i
z_i
zi联系在一起。
另外一个很重要的信息就是y和z正确配对后有
e
L
⊥
U
n
\boldsymbol{e}_L\bot \boldsymbol{U}_n
eL⊥Un,所以只需要最大化下面的式子就可以找到对应的2D频率——
M
a
x
i
m
i
z
e
⟶
1
∑
i
=
I
+
1
min
∣
∣
u
i
H
e
L
(
f
1
,
f
2
)
∣
∣
(
39
)
Maximize\longrightarrow \,\,\frac{1}{\sum_{i=I+1}^{\min}{||\boldsymbol{u}_{i}^{H}\boldsymbol{e}_L\left( f_1,f_2 \right) ||}} \left( 39 \right)
Maximize⟶∑i=I+1min∣∣uiHeL(f1,f2)∣∣1(39)
matrix pencil
Matrix pencil在Gene H.Golub教授的《Matrix Computations》2中的描述如下:
If A , B ∈ C n × n A,B\in \mathbb{C} ^{n\times n} A,B∈Cn×n,then the set of all matrices of the form A − λ B A-\lambda B A−λB with λ ∈ C \lambda\in \mathbb{C} λ∈C is a p e n c i l {\color{red} pencil} pencil.
The g e n e r a l i z e d e i g e n v a l u e s {\color{blue} generalized\,\,eigenvalues} generalizedeigenvalues of A − λ B A-\lambda B A−λB are elements of the set λ ( A , B ) \lambda \left( A,B \right) λ(A,B) defined by
λ ( A , B ) = { z ∈ C : det ( A − z B ) = 0 } \lambda \left( A,B \right) =\left\{ z\in \mathbb{C} :\det \left( A-zB \right) =0 \right\} λ(A,B)={z∈C:det(A−zB)=0}
If λ ∈ λ ( A , B ) a n d 0 ≠ x ∈ C n s a t i s f i e s \lambda \in \lambda \left( A,B \right) \,\,and\,\,0\ne x\in \mathbb{C} ^n\,\,satisfies λ∈λ(A,B)and0=x∈Cnsatisfies.
A x = λ B x Ax=\lambda Bx Ax=λBx
Then x x x is an e i g e n v e c t o r {\color{blue} eigenvector} eigenvector of A − λ B A-\lambda B A−λB.
矩阵铅笔方法可以看成将两个矩阵以某种方式重构使得需要估计的参数等于矩阵铅笔的秩的减少数(如广义特征值)。
提取 y i y_i yi
假设充分条件(29)可以被满足,则
r
a
n
g
e
(
U
s
)
=
r
a
n
g
e
(
E
L
)
range\left( \boldsymbol{U}_s \right) =range\left( \boldsymbol{E}_L \right)
range(Us)=range(EL),于是
有且仅有唯一一个
I
×
I
I\times I
I×I的非奇异矩阵
T
\boldsymbol{T}
T,使得
U
s
=
E
L
T
.
\boldsymbol{U}_s=\boldsymbol{E}_L\boldsymbol{T}.
Us=ELT.
T
\boldsymbol{T}
T的唯一性可以由
U
s
\boldsymbol{U}_s
Us与
E
L
\boldsymbol{E}_L
EL列满秩(均包含独立的
I
I
I列)得到。
{
U
1
=
U
s
但是不包含
U
s
的最后
L
行
U
2
=
U
s
但是不包含
U
s
的开头
L
行
{
U
1
=
E
1
T
U
2
=
E
1
Y
d
T
\left\{ \begin{array}{c} \boldsymbol{U}_1=\boldsymbol{U}_s\,\,\text{但是不包含}U_s\text{的最后}L\text{行}\\ \boldsymbol{U}_2=\boldsymbol{U}_s\text{但是不包含}U_s\text{的开头}L\text{行}\\ \end{array} \right. \left\{ \begin{array}{c} \boldsymbol{U}_1=\boldsymbol{E}_1\boldsymbol{T}\\ \boldsymbol{U}_2=\boldsymbol{E}_1\boldsymbol{Y}_d\boldsymbol{T}\\ \end{array} \right.
{U1=Us但是不包含Us的最后L行U2=Us但是不包含Us的开头L行{U1=E1TU2=E1YdT
U
2
\boldsymbol{U}_2
U2和
U
1
\boldsymbol{U}_1
U1构成的矩阵铅笔包含了
U
2
−
λ
U
1
=
E
1
(
Y
d
−
λ
I
)
T
\boldsymbol{U}_2-\lambda \boldsymbol{U}_1=\boldsymbol{E}_1\left( \boldsymbol{Y}_d-\lambda \boldsymbol{I} \right) \boldsymbol{T}
U2−λU1=E1(Yd−λI)T
所以满足
U
2
−
λ
U
1
=
0
\boldsymbol{U}_2-\lambda \boldsymbol{U}_1=0
U2−λU1=0的广义特征值就是
Y
d
=
d
i
a
g
[
y
1
,
y
2
,
⋯
,
y
I
]
。
\boldsymbol{Y}_d=\mathrm{diag}\left[ y_1,y_2,\cdots ,y_I \right] 。
Yd=diag[y1,y2,⋯,yI]。
也就是说
y
i
y_i
yi就是矩阵铅笔
U
2
−
λ
U
1
\boldsymbol{U}_2-\lambda \boldsymbol{U}_1
U2−λU1减少的秩(因为当
λ
i
=
y
i
\lambda _i=y_i
λi=yi矩阵铅笔的秩就会减一)。上述推理要求矩阵
E
1
\boldsymbol{E}_1
E1和
T
\boldsymbol{T}
T均列满秩为
I
I
I.
提取 z i z_i zi
矩阵
P
\boldsymbol{P}
P将
E
L
\boldsymbol{E}_L
EL重排成
E
L
P
\boldsymbol{E}_{LP}
ELP,于是将
U
s
\boldsymbol{U}_s
Us重排成
U
s
P
\boldsymbol{U}_{sP}
UsP
U
s
P
=
P
U
s
{
U
1
P
=
U
s
P
但是不包含
U
s
P
的最后
K
行
U
2
P
=
U
s
P
但是不包含
U
s
P
的开头
K
行
U
2
P
−
λ
U
1
P
=
E
1
P
(
Z
d
−
λ
I
)
T
\boldsymbol{U}_{sP}=\boldsymbol{PU}_s \\ \left\{ \begin{array}{c} \boldsymbol{U}_{1P}=\boldsymbol{U}_{sP}\,\,\text{但是不包含}\boldsymbol{U}_{sP}\text{的最后}K\text{行}\\ \boldsymbol{U}_{2P}=\boldsymbol{U}_{sP}\text{但是不包含}\boldsymbol{U}_{sP}\text{的开头}K\text{行}\\ \end{array} \right. \\ \boldsymbol{U}_{2P}-\lambda \boldsymbol{U}_{1P}=\boldsymbol{E}_{1P}\left( \boldsymbol{Z}_d-\lambda \boldsymbol{I} \right) \boldsymbol{T}
UsP=PUs{U1P=UsP但是不包含UsP的最后K行U2P=UsP但是不包含UsP的开头K行U2P−λU1P=E1P(Zd−λI)T
所以满足
U
2
P
−
λ
U
1
P
=
0
\boldsymbol{U}_{2P}-\lambda \boldsymbol{U}_{1P}=0
U2P−λU1P=0的广义特征值就是
Z d = d i a g [ z 1 , z 2 , ⋯ , z I ] . \boldsymbol{Z}_d=\mathrm{diag}\left[ z_1,z_2,\cdots ,z_I \right]. Zd=diag[z1,z2,⋯,zI].
K K K和 L L L满足的条件
{
r
(
E
1
)
=
I
⟶
{
K
−
1
⩾
I
L
⩾
I
r
(
E
1
P
)
=
I
⟶
{
K
⩾
I
L
−
1
⩾
I
(
40
)
\left\{ \begin{array}{c} r\left( \boldsymbol{E}_1 \right) =I\longrightarrow \left\{ \begin{array}{c} K-1\geqslant I\,\,\\ L\geqslant I\\ \end{array} \right.\\ r\left( \boldsymbol{E}_{1P} \right) =I\longrightarrow \left\{ \begin{array}{c} K\geqslant I\,\,\\ L-1\geqslant I\\ \end{array} \right.\\ \end{array} \right. \left( 40 \right)
⎩
⎨
⎧r(E1)=I⟶{K−1⩾IL⩾Ir(E1P)=I⟶{K⩾IL−1⩾I(40)
结合(40)和(29)得到MEMP的总体充分条件:
{
M
−
I
+
1
>
K
⩾
I
+
1
N
−
I
+
1
⩾
L
−
I
+
1
(
41
)
\left\{ \begin{array}{c} M-I+1>K\geqslant I+1\\ N-I+1\geqslant L-I+1\\ \end{array} \right. \left( 41 \right)
{M−I+1>K⩾I+1N−I+1⩾L−I+1(41)
必要条件是
{
(
K
−
1
)
L
⩾
I
K
(
L
−
1
)
⩾
I
(
M
−
K
+
1
)
(
N
−
L
+
1
)
⩾
I
(
42
)
\left\{ \begin{array}{c} \left( K-1 \right) L\geqslant I\\ K\left( L-1 \right) \geqslant I\\ \left( M-K+1 \right) \left( N-L+1 \right) \geqslant I\\ \end{array} \right. \left( 42 \right)
⎩
⎨
⎧(K−1)L⩾IK(L−1)⩾I(M−K+1)(N−L+1)⩾I(42)
2D 匹配pairing
现在可以通过matrix pencil构造出2D频率就是
U
2
−
λ
U
1
\boldsymbol{U}_2-\lambda \boldsymbol{U}_1
U2−λU1和
U
2
P
−
λ
U
1
P
\boldsymbol{U}_{2P}-\lambda \boldsymbol{U}_{1P}
U2P−λU1P的广义特征值,但不一定是对应匹配的。
(39)表明,对于
I
I
I组2D频率pair,我们应该要
M
i
n
i
m
i
z
e
⟶
J
n
(
i
,
j
)
=
∑
i
=
I
+
1
min
∣
∣
u
i
H
e
L
(
y
i
,
z
j
)
∣
∣
2
(
43
)
Minimize\longrightarrow J_n\left( i,j \right) =\,\,\sum_{i=I+1}^{\min}{||\boldsymbol{u}_{i}^{H}\boldsymbol{e}_L\left( y_i,z_j \right) ||^2}\left( 43 \right)
Minimize⟶Jn(i,j)=i=I+1∑min∣∣uiHeL(yi,zj)∣∣2(43)
由SVD特性,
M
a
x
i
m
i
z
e
⟶
J
n
(
i
,
j
)
=
∑
i
=
1
I
∣
∣
u
i
H
e
L
(
y
i
,
z
j
)
∣
∣
2
(
44
)
Maximize\longrightarrow J_n\left( i,j \right) =\,\,\sum_{i=1}^I{||\boldsymbol{u}_{i}^{H}\boldsymbol{e}_L\left( y_i,z_j \right) ||^2}\left( 44 \right)
Maximize⟶Jn(i,j)=i=1∑I∣∣uiHeL(yi,zj)∣∣2(44)
所以遍历
y
i
y_i
yi和
z
i
z_i
zi使得(44)满足即可。