Matrix pencil矩阵铅笔算法(原始论文记录与复现)（一）

zSalty

已于 2024-01-06 22:08:00 修改

阅读量871

点赞数 8

文章标签：算法矩阵线性代数

于 2024-01-06 01:13:58 首次发布

本文链接：https://blog.csdn.net/qq_43660199/article/details/135309567

版权

《Estimating two-dimensional frequencies by matrix enhancement and matrix pencil》¹

文章目录

问题概述
- 2D频率估计问题
- 问题的矩阵分解和简化
一、算法推导与展开
总结

问题概述

2D频率估计问题

从多径2D频率信号的 $\sum{}$ 和式中分离出所有的频率分量的问题。

我们考虑一个无噪的二维频率数据域的2D-sample结构表达式——
$x\left( m;n \right) =\sum_{i=1}^I{r_i\exp \left( j\phi _i+j2\pi f_{1i}m+j2\pi f_{2i}n \right)}\,\, \left( 1 \right)$
其中， $0\leqslant m\leqslant M, 0\leqslant n\leqslant N.$
(1)表明2D频率的数据由I个多径的2D-frequencies参数：
$\left\{ \left( f_{1i},f_{2i} \right) ;i=1,\cdots ,I \right\} ,\left\{ r_i:i=1,\cdots ,I \right\} ,\left\{ \phi _i;i=1,\cdots ,I \right\}$
分别为(非零的)模值、频率和相位。这些参数需要被估计。
在噪声系统中——
$x^{\prime}\left( m;n \right) =x\left( m;n \right) +w\left( m;n \right) \,\,$

其中 $w\left( m;n \right)$ 为2D的噪声序列（实际系统往往存在噪声）。

从式子(1)来看， $r_i,\phi _i$ 可以很容易得到一旦 $\left\{ \left( f_{1i},f_{2i} \right) ;i=1,\cdots ,I \right\}$ 被精确估计之后因为根据指数乘法的性质 $r_i\exp \left( j\phi _i \right)$ 可以被线性地抽离出来。

问题的矩阵分解和简化

以exp为最小粒度重写式子(1)，可以得到——
$x\left( m;n \right) =\sum_{i=1}^I{a_iy_{i}^{m}z_{i}^{n}\,\, \left( 2 \right)}$
其中 $\left\{ \begin{array}{c} y_i=\exp \left( j2\pi f_{1i} \right)(3)\\ z_i=\exp \left( j2\pi f_{2i} \right)(4)\\ a_i=r_i\exp \left( j\phi _i \right)(5)\\ \end{array} \right.。$ 对 $y_i$ 和 $z_i$ 的估计就对 $f_{1i}$ 和 $f_{2i}$ 的估计。
已知的抽样信号矩阵的形式如下——
$\boldsymbol{X}=\left[ \begin{matrix} \,\,x\left( 0;0 \right)& \,\,x\left( 0;1 \right)& \cdots& x\left( 0;N-1 \right)\\ \,\,x\left( 1;0 \right)& \,\,x\left( 1;1 \right)& \cdots& x\left( 1;N-1 \right)\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ x\left( M-1;0 \right)& x\left( M-1;1 \right)& \cdots& x\left( M-1;N-1 \right)\\ \end{matrix} \right] \,\, \left( 6 \right)$
由(3)在(7)的形式中可以得到——
$\boldsymbol{X}=\boldsymbol{YAZ}\left( 7 \right) \\ \boldsymbol{Y}=\left[ \begin{matrix} \,\,1& \,\,1& \cdots& 1\\ \,y_1& \,\,y_2& \cdots& y_I\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ y_{1}^{M-1}& y_{2}^{M-1}& \cdots& y_{I}^{M-1}\\ \end{matrix} \right] \left( 8 \right) \\ \boldsymbol{A}=\mathrm{diag}\left[ a_1,a_2,\cdots ,a_I \right] \left( 9 \right) \\ \boldsymbol{Z}=\left[ \begin{matrix} \,\,1& \,\,z_1& \cdots& z_{1}^{N-1}\\ \,1& \,\,z_2& \cdots& z_{2}^{N-1}\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ 1& z_I& \cdots& z_{I\,\,}^{N-1}\\ \end{matrix} \right] \left( 10 \right)$
(这种二维形式的矩阵分解和乘法形式是常见的可以记住。)

具体的推导过程:
$\boldsymbol{X}_{M\times N}=\underbrace{\left[ \begin{matrix} \,\,1& \,\,1& \cdots& 1\\ \,y_1& \,\,y_2& \cdots& y_I\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ y_{1}^{M-1}& y_{2}^{M-1}& \cdots& y_{I}^{M-1}\\ \end{matrix} \right] _{M\times I}\left[ \begin{matrix} \,\,a_1& \,\,0& \cdots& 0\\ \,0& \,\,a_2& \cdots& 0\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ 0& 0& \cdots& a_I\\ \end{matrix} \right] }_{I\times I}\left[ \begin{matrix} \,\,1& \,\,z_1& \cdots& z_{1}^{N-1}\\ \,1& \,\,z_2& \cdots& z_{2}^{N-1}\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ 1& z_I& \cdots& z_{I\,\,}^{N-1}\\ \end{matrix} \right] _{I\times N} \\ =\left[ \begin{matrix} \,\,a_1y_{1}^{0}& a_2y_{2}^{0}\,\,& \cdots& a_Iy_{I}^{0}\\ \,a_1y_{1}^{1}& \,\,a_2y_{2}^{1}& \cdots& a_Iy_{I}^{1}\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ a_1y_{1}^{M-1}& a_2y_{2}^{M-1}& \cdots& a_Iy_{I}^{M-1}\\ \end{matrix} \right] \left[ \begin{matrix} \,\,z_{1}^{0}& \,\,z_1& \cdots& z_{1}^{N-1}\\ \,z_{2}^{0}& \,\,z_2& \cdots& z_{2}^{N-1}\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ z_{I}^{0}& z_I& \cdots& z_{I\,\,}^{N-1}\\ \end{matrix} \right] \\ =\left[ \begin{matrix} \,\,\sum_{i=1}^I{a_iy_{i}^{0}}z_{i}^{0}& \sum_{i=1}^I{a_iy_{i}^{0}}z_{i}^{1}\,\,& \cdots& \sum_{i=1}^I{a_iy_{i}^{0}}z_{i}^{N-1}\\ \,\sum_{i=1}^I{a_iy_{i}^{1}}z_{i}^{0}& \,\sum_{i=1}^I{a_iy_{i}^{1}}z_{i}^{1}& \cdots& \sum_{i=1}^I{a_iy_{i}^{1}}z_{i}^{N-1}\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ \sum_{i=1}^I{a_iy_{i}^{M-1}}z_{i}^{0}& \sum_{i=1}^I{a_iy_{i}^{M-1}}z_{i}^{1}& \cdots& \sum_{i=1}^I{a_iy_{i}^{M-1}}z_{i}^{N-1}\\ \end{matrix} \right] \\ =\left[ \begin{matrix} \,\,x\left( 0;0 \right)& \,\,x\left( 0;1 \right)& \cdots& x\left( 0;N-1 \right)\\ \,\,x\left( 1;0 \right)& \,\,x\left( 1;1 \right)& \cdots& x\left( 1;N-1 \right)\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ x\left( M-1;0 \right)& x\left( M-1;1 \right)& \cdots& x\left( M-1;N-1 \right)\\ \end{matrix} \right] \text{证毕}.$
·顺便复习一下考研中关于矩阵乘法 $A_{m\times n}B_{n\times p}=C_{m\times p}$ 的行列分块和秩的结论。
对 $A$ 做列分块，于是有
$\left[ \boldsymbol{r}_1,\cdots ,\boldsymbol{r}_n \right] \left[ \begin{matrix} b_{11}& \cdots& b_{1p}\\ \vdots& \vdots& \vdots\\ b_{n1}& \cdots& b_{np}\\ \end{matrix} \right] =\left[ \boldsymbol{c}_1,\cdots ,\boldsymbol{c}_p \right] \\ \left\{ \begin{array}{c} b_{11}\boldsymbol{r}_1+b_{21}\boldsymbol{r}_2+\cdots +b_{n1}\boldsymbol{r}_n=\boldsymbol{c}_1\\ \vdots\\ b_{1i}\boldsymbol{r}_1+b_{2i}\boldsymbol{r}_2+\cdots +b_{ni}\boldsymbol{r}_n=\boldsymbol{c}_i\\ \vdots\\ b_{1p}\boldsymbol{r}_1+b_{2p}\boldsymbol{r}_2+\cdots +b_{np}\boldsymbol{r}_n=\boldsymbol{c}_p\\ \end{array} \right.$
$C = A B$ 的列向量可以由 $A$ 的列向量线性表出。同时表明如果 $A$ 列满秩， $r (A B) = r (B)$ 。即左乘列满秩矩阵秩不变。
对 $B$ 做行分块，于是有
$\left[ \begin{matrix} a_{11}& \cdots& a_{1n}\\ \vdots& \vdots& \vdots\\ a_{m1}& \cdots& a_{mn}\\ \end{matrix} \right] \left[ \begin{array}{c} \boldsymbol{b}_1\\ \vdots\\ \boldsymbol{b}_n\\ \end{array} \right] =\left[ \begin{array}{c} c_1\\ \vdots\\ c_m\\ \end{array} \right] \\ \left\{ \begin{array}{c} a_{11}\boldsymbol{b}_1+a_{12}\boldsymbol{b}_2+\cdots +a_{1n}\boldsymbol{b}_n=\boldsymbol{c}_1\\ \vdots\\ a_{i1}\boldsymbol{b}_1+a_{i2}\boldsymbol{b}_2+\cdots +a_{in}\boldsymbol{b}_n=\boldsymbol{c}_i\\ \vdots\\ a_{m1}\boldsymbol{b}_1+a_{m2}\boldsymbol{b}_2+\cdots +a_{mn}\boldsymbol{b}_n=\boldsymbol{c}_m\\ \end{array} \right.$
$C = A B$ 的行向量可以由 $B$ 的列向量线性表出。同时表明如果 $B$ 行满秩， $r (A B) = r (A)$ 。即右乘行满秩矩阵秩不变。
同时表明，对于式子(3)矩阵 $X_{m,n}=\sum_{i=1}^I{a_iy_{i}^{m}z_{i}^{n}}$ 来说， $z_{i}^{n}$ 是来自于(10)中 $Z$ 的第 $n$ 列的贡献， $y_{i}^{m}$ 是来自于(10)中 $Y$ 的第 $m$ 行的贡献，对角矩阵 $A$ 则是将相应的 $y_{i}^{m}$ 和 $z_{i}^{n}$ $co n c a t$ 起来，于是上面式子的由来被完整地梳理了一遍。

式子(7) $\longrightarrow$ $r\left( YAZ \right) \ll r\left( A \right) =I$ ,等号当且仅当 $Y$ 列满秩、 $Z$ 行满秩且 $M\geqslant I, N\geqslant I$ . 观察到 $Y$ 和 $Z$ 矩阵的 $Van d er M o n d e$ 形式，上述条件可以被恒等转化为 $\left\{ y_i;i=1,\cdots ,I \right\}$ 和 $\left\{ z_i;i=1,\cdots ,I \right\}$ 都不包含重复值否则对于 $r (X) = I$ 这个条件的推理的不够充分的(是一种病态条件)。~~ps:原文中作者认为只要2D频率对~~ $\left\{ \left\{ y_i,z_i \right\} ;i=1,\cdots ,I \right\}$ 的每组的独立的就ok，也就是允许 $y$ 和 $z$ 的单独频率可以重复但需要错开，我认为这种方法不能够保证Y和Z的满秩条件，在仿真的实验中也验证了 $y$ 和 $z$ 都需要分别包含不重复值这一结论，评论区有对这个问题思考的可以一起交流！
(update:这里后来重新理解了一下就是式子(7)要使 $X$ 秩为 $I$ 确实要y和z都不包含相同值，但是从后面增强矩阵式子(25)可以看出只要yz对没有重复值就可以很好地恢复，所以在这个意义上这种增强强化了MEMP算法的使用范畴比较2D对重复的可能性比1D频率重复的可能性小得多。)

一、算法推导与展开

matrix enhancement

增强型矩阵 $\boldsymbol{X}_e$

通过矩阵的分隔和合并来构造增强后的Hankle-block矩阵(每一条副对角线上的元素都相等)
$\boldsymbol{X}_e=\left[ \begin{matrix} \boldsymbol{X}_0& \boldsymbol{X}_1& \cdots& \boldsymbol{X}_{M-K}\\ \boldsymbol{X}_1& \boldsymbol{X}_2& \cdots& \boldsymbol{X}_{M-K+1}\\ \vdots& \vdots& \cdots& \vdots\\ \boldsymbol{X}_{K-1}& \boldsymbol{X}_K& \cdots& \boldsymbol{X}_{M-1}\\ \end{matrix} \right] _{KL\times \left( M-K+1 \right) \left( N-L+1 \right)}\left( 11 \right)$
其中——
$\boldsymbol{X}_m=\left[ \begin{matrix} x\left( m;0 \right)& x\left( m;1 \right)& \cdots& x\left( m;N-L \right)\\ x\left( m;1 \right)& x\left( m;2 \right)& \cdots& x\left( m;N-L+1 \right)\\ \vdots& \vdots& \cdots& \vdots\\ x\left( m;L-1 \right)& x\left( m;L \right)& \cdots& x\left( m;N-1 \right)\\ \end{matrix} \right] _{L\times \left( N-L+1 \right)}\left( 12 \right)$
$\boldsymbol{X}_m$ 是给定 $m$ 之后对 $x\left( m;0 \right) \longrightarrow x\left( m;N-1 \right)$ 以 $L$ 为长度做滑动的矩阵。
$\boldsymbol{X}_e$ 是 $m$ 取值在 $0\longrightarrow M-1$ 之间的以 $K$ 为长度做滑动的 $\boldsymbol{X}_m$ 。
式子(2)带入(12)，
$\boldsymbol{X}_m=\boldsymbol{Z}_L\boldsymbol{AY}_{d}^{m}\boldsymbol{Z}_R\left( 13 \right) \\ \boldsymbol{Z}_L=\left[ \begin{matrix} \,\,z_{1}^{0}& \,\,z_{2}^{0}& \cdots& z_{I}^{0}\\ \,z_1& \,\,z_2& \cdots& z_I\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ z_{1}^{L-1}& z_{2}^{L-1}& \cdots& z_{I\,\,}^{L-1}\\ \end{matrix} \right] _{L\times I}\left( 14 \right) \\ \boldsymbol{Y}_d=\mathrm{diag}\left[ y_1,y_2,\cdots ,y_I \right] \left( 15 \right) \\ \boldsymbol{Z}_R=\left[ \begin{matrix} \,\,z_{1}^{0}& \,\,z_1& \cdots& z_{1}^{N-L}\\ \,z_{2}^{0}& \,\,z_2& \cdots& z_{2}^{N-L}\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ z_{I}^{0}& z_I& \cdots& z_{I\,\,}^{N-L}\\ \end{matrix} \right] _{I\times N-L+1}\left( 16 \right)$
式子(13)的由来和(7)类似，对于式子(12)的矩阵 ${\boldsymbol{X}_m}_{\left( pq \right)}=x\left( m;p+q \right) =\sum_{i=1}^I{a_iy_{i}^{m}z_{i}^{p+q}}$ , 其中 $p, q$ 从0开始索引， $a_iy_{i}^{m}$ 由两个对角矩阵的乘积 $\boldsymbol{AY}_{d}^{m}$ 贡献， $z_{i}^{p+q}$ 由第 $p$ 行的 $\boldsymbol{Z}_L$ 和第 $q$ 列的 $\boldsymbol{Z}_R$ 的内积贡献，以上思路同式子(7)的由来。
将(13)带入(11),
$\boldsymbol{X}_e=\boldsymbol{E}_L\boldsymbol{AE}_R\left( 17 \right) \\ \boldsymbol{E}_L=\left[ \begin{array}{l} \boldsymbol{Z}_L\\ \boldsymbol{Z}_L\boldsymbol{Y}_d\\ \cdots\\ \boldsymbol{Z}_L\boldsymbol{Y}_{d}^{K-1}\\ \end{array} \right] _{KL\times I}\left( 18 \right) \\ \boldsymbol{E}_R=\left[ \boldsymbol{Z}_R,\boldsymbol{Y}_d\boldsymbol{Z}_R,\cdots ,\boldsymbol{Y}_{d}^{M-K}\boldsymbol{Z}_R \right] _{I\times \left( N-L+1 \right) \left( M-K+1 \right)}\left( 19 \right)$
式子(17)的由来还是类似上面，
${\boldsymbol{X}_e}_{\left( pq \right)}=\boldsymbol{X}_{p+q-2}=\boldsymbol{Z}_L\boldsymbol{AY}_{d}^{p+q-2}\boldsymbol{Z}_R=\boldsymbol{Z}_L\boldsymbol{Y}_{d}^{p-1}\boldsymbol{AY}_{d}^{q-1}\boldsymbol{Z}_R=\boldsymbol{E}_L\left( p,: \right) \cdot \boldsymbol{A}\cdot \boldsymbol{E}_R\left( :,q \right) \left( 20 \right)$
式子(17)表明增强后的矩阵 $\boldsymbol{X}_e$ 满足
$r\left( \boldsymbol{X}_e \right) =I\Leftrightarrow r\left( \boldsymbol{E}_L \right) =r\left( \boldsymbol{E}_R \right) =I$

$K$ 和 $L$ 满足的条件

$r\left( \boldsymbol{E}_L \right) =I\Leftrightarrow K\geqslant I\,\,and\,\,L\gg I.$

原文中引入了一个shuffle重拍列矩阵
$\boldsymbol{P}=\left[ \begin{array}{c} \begin{array}{c} \boldsymbol{p}^T\left( 1 \right)\\ \boldsymbol{p}^T\left( 1+L \right)\\ \cdots\\ \boldsymbol{p}^T\left( 1+\left( K-1 \right) L \right)\\ \end{array}\\ \begin{array}{c} \boldsymbol{p}^T\left( 2 \right)\\ \boldsymbol{p}^T\left( 2+L \right)\\ \cdots\\ \boldsymbol{p}^T\left( 2+\left( K-1 \right) L \right)\\ \cdots\\ \cdots\\ \begin{array}{c} \boldsymbol{p}^T\left( L \right)\\ \boldsymbol{p}^T\left( L+L \right)\\ \cdots\\ \boldsymbol{p}^T\left( L+\left( K-1 \right) L \right)\\ \end{array}\\ \end{array}\\ \end{array} \right] _{KL\times KL} \left( 21 \right)$
其中 $\boldsymbol{p}\left( i \right)$ 表示一个长度为 $K L$ 的列向量，其中位置是 $i$ 为1，其余为0,易得
$\boldsymbol{E}_{LP}=\boldsymbol{PE}_L \left( 22 \right) \\ \boldsymbol{E}_{LP}=\left[ \begin{array}{c} \boldsymbol{Y}_L\\ \boldsymbol{Y}_L\boldsymbol{Z}_d\\ \cdots\\ \boldsymbol{Y}_L\boldsymbol{Z}_{d}^{L-1}\\ \end{array} \right] _{KL\times I} \left( 23 \right) \\ \boldsymbol{Y}_L=\left[ \begin{matrix} \,\,1& \,\,1& \cdots& 1\\ \,y_1& \,\,y_2& \cdots& y_I\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ y_{1}^{L-1}& y_{2}^{L-1}& \cdots& y_{I}^{L-1}\\ \end{matrix} \right] _{L\times I} \left( 24 \right) \\ \boldsymbol{Z}_d=\mathrm{diag}\left( z_1,z_2,\cdots ,z_I \right) \left( 25 \right)$
$\boldsymbol{P}$ 的作用就是交换 $\boldsymbol{E}_L$ 中y和z的位置，即 $y_i$ 在 $\boldsymbol{E}_L$ 的位置相当于 $z_i$ 在 $\boldsymbol{E}_{LP}$ . 这种重拍变换的逻辑在于在 $\boldsymbol{E}_L$ 的矩阵结构中——
$for\,\,\boldsymbol{E}_L=\left[ \begin{array}{l} \boldsymbol{Z}_L\\ \boldsymbol{Z}_L\boldsymbol{Y}_d\\ \cdots\\ \boldsymbol{Z}_L\boldsymbol{Y}_{d}^{L-1}\\ \end{array} \right] _{KL\times I}=\left[ \begin{array}{l} \left[ \begin{matrix} y_{1}^{0}& y_{2}^{0}& \cdots& y_{I}^{0}\\ z_1y_{1}^{0}& z_2y_{2}^{0}& \cdots& z_Iy_{I}^{0}\\ \vdots& \vdots& \vdots& \vdots\\ z_{1}^{L-1}y_{1}^{0}& z_{2}^{L-1}y_{2}^{0}& \cdots& z_{I}^{L-1}y_{I}^{0}\\ \end{matrix} \right]\\ \left[ \begin{matrix} y_{1}^{1}& y_{2}^{1}& \cdots& y_{I}^{1}\\ z_1y_{1}^{1}& z_2y_{2}^{1}& \cdots& z_Iy_{I}^{1}\\ \vdots& \vdots& \vdots& \vdots\\ z_{1}^{L-1}y_{1}^{1}& z_{2}^{L-1}y_{2}^{1}& \cdots& z_{I}^{L-1}y_{I}^{1}\\ \end{matrix} \right]\\ \cdots\\ \left[ \begin{matrix} y_{1}^{K-1}& y_{2}^{K-1}& \cdots& y_{I}^{K-1}\\ z_1y_{1}^{K-1}& z_2y_{2}^{K-1}& \cdots& z_Iy_{I}^{K-1}\\ \vdots& \vdots& \vdots& \vdots\\ z_{1}^{L-1}y_{1}^{K-1}& z_{2}^{L-1}y_{2}^{K-1}& \cdots& z_{I}^{L-1}y_{I}^{K-1}\\ \end{matrix} \right]\\ \end{array} \right] \left( 25 \right)$
相当于取每个矩阵的第一行拼接在一起，然后第二行，以此类推，相当于对行进行了重排。这样就把y和z的位置交换，同时也把K和L交换。
这样 $\boldsymbol{Z}_L$ 和 $\boldsymbol{Y}_L$ 都是 $\boldsymbol{E}_L$ 的子矩阵，于是有
$r\left( \boldsymbol{E}_L \right) \geqslant r\left[ \begin{array}{c} \boldsymbol{Z}_L\\ \boldsymbol{Y}_L\\ \end{array} \right] =r\left[ \begin{array}{c} \left[ \begin{matrix} \,\,z_{1}^{0}& \,\,z_{2}^{0}& \cdots& z_{I}^{0}\\ \,z_1& \,\,z_2& \cdots& z_I\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ z_{1}^{L-1}& z_{2}^{L-1}& \cdots& z_{I\,\,}^{L-1}\\ \end{matrix} \right] _{L\times I}\\ \left[ \begin{matrix} \,\,y_{1}^{0}& \,\,y_{2}^{0}& \cdots& y_{I}^{0}\\ \,y_1& \,\,y_2& \cdots& y_I\\ \,\,\vdots& \,\,\vdots& \cdots& \,\,\vdots\\ y_{1}^{L-1}& y_{2}^{L-1}& \cdots& y_{I}^{L-1}\\ \end{matrix} \right] _{L\times I}\\ \end{array} \right] \left( 26 \right)$
如果 $\left\{ \left( y_i,z_i \right) ;i=1,2,\cdots ,I \right\} is\,\,distinct$ . (26)矩阵列满秩
$\therefore$ 当 $K\geqslant I\,\,and\,\,L\gg I \longrightarrow r\left( \boldsymbol{E}_L \right) =I$ .充分性得证。
关于必要性，由于 $\boldsymbol{E}_L$ 是 $K L$ 行 $I$ 列矩阵，所以 $r\left( \boldsymbol{E}_L \right) =I$ 必须有 $KL\geqslant I$ ，这个条件不够强，可能会失效，而充分条件是最严格的，即
$K\geqslant I\,\,and\,\,L\gg I\left( 27 \right) \\ KL\gg I\left( 28 \right)$
根据对称性可以得到 $\boldsymbol{E}_R$ 侧的结论，
$(M-K+1)\geqslant I\,\,and\,\,(N-L+1)\gg I\left( 29 \right) \\ (M-K+1)(N-L+1)\gg I\left( 30 \right)$
事实上, $\boldsymbol{E}_L$ 和 $\boldsymbol{E}_R$ 是行拼接和列拼接分别对应列满秩和行满秩的特征， $\boldsymbol{E}_R$ 侧的 $\boldsymbol{P}$ 矩阵是做列shuffle重排！

$\boldsymbol{X}_e$ 的特征结构

我们考虑从 $\boldsymbol{X}_e$ 中提取2D的频率信息——
对 $\boldsymbol{X}_e$ 做SVD分解，得到

$\boldsymbol{X}_e=\sum_{i=1}^{\min}{\sigma _i\boldsymbol{u}_i\boldsymbol{v}_{i}^{H}} =\boldsymbol{U}_s\varSigma _s\boldsymbol{V}_{s}^{H}+\boldsymbol{U}_n\varSigma _n\boldsymbol{V}_{n}^{H}\left( 31 \right) \\ \boldsymbol{U}_s=\left[ \boldsymbol{u}_1,\boldsymbol{u}_2,\cdots ,\boldsymbol{u}_I \right] \left( 31.a \right) \\ \varSigma _s=\mathrm{diag}\left[ \sigma _1,\sigma _2,\cdots ,\sigma _I \right] \left( 31.b \right) \\ \boldsymbol{V}_s=\left[ \boldsymbol{v}_1,\boldsymbol{v}_2,\cdots ,\boldsymbol{v}_I \right] \left( 31.c \right) \\ \boldsymbol{U}_n=\left[ \boldsymbol{u}_{I+1},\boldsymbol{u}_{I+2},\cdots ,\boldsymbol{u}_{\min} \right] \left( 31.d \right) \\ \varSigma _n=\mathrm{diag}\left[ \sigma _{I+1},\sigma _{I+2},\cdots ,\sigma _{\min} \right] \left( 31.e \right) \\ \boldsymbol{V}_n=\left[ \boldsymbol{v}_{I+1},\boldsymbol{v}_{I+2},\cdots ,\boldsymbol{v}_{\min} \right] \left( 31.f \right) \\$
这里 $\sigma _1\geqslant \sigma _2\geqslant \cdots \geqslant \sigma _{\min}$ .对于无噪声的情况，只有 $I$ 个非零奇异值，而有噪声情况下，噪声带来的奇异值的扰动会和2D频率的奇异值相差较大从而可以分离出多径，从而预测 $I$ 。
由于 $r\left( X_e \right) =r\left( E_L \right) =I$ ,所以
$range\left( X_e \right) =range\left( E_L \right) =range\left( U_s \right) \\ range\left( X_{e}^{H} \right) =range\left( E_{R}^{H} \right) =range\left( V_s \right) \left( 32 \right)$
这是因为式子(17)中 $\boldsymbol{E}_L$ 列满秩， $\boldsymbol{E}_R$ 行满秩，所以SVD的 $U$ 矩阵的列空间和原矩阵的列空间一致， $V$ 矩阵的行空间和原矩阵的行空间一致。
再次考虑(18)(25)中 $\boldsymbol{E}_L$ 的结构, $\boldsymbol{E}_L$ 的第 $i$ 列可以被表示为
$\boldsymbol{e}_{Li}=\boldsymbol{y}_{Li}\otimes \boldsymbol{z}_{Li} \left( 33 \right)$
其中 $\otimes$ 代表Kronecker product。
这代表 $\boldsymbol{E}_L$ 的列向量可以和 $y_i$ 和 $z_i$ 的克罗内克积。式子(33)表明了 $\boldsymbol{E}_L$ 、 $\boldsymbol{y}_L$ 和 $\boldsymbol{z}_L$ 之间的关系，
$\boldsymbol{e}_L=\boldsymbol{y}_L\otimes \boldsymbol{z}_L\left( 34 \right)$
其中，
$\boldsymbol{y}_L=\left[ 1,y,\cdots ,y^{K-1} \right] ^T\left( 35 \right) \\ \boldsymbol{z}_L=\left[ 1,z,\cdots ,z^{L-1} \right] ^T\left( 36 \right) \\ y=\exp \left( j2\pi f_1 \right) \left( 37 \right) \\ z=\exp \left( j2\pi f_2 \right) \left( 38 \right)$
可以发现
$\boldsymbol{e}_L\in \left\{ \boldsymbol{e}_{L1},\boldsymbol{e}_{L2},\cdots ,\boldsymbol{e}_{LI} \right\} \Leftrightarrow \left( f_1,f_2 \right) =\left( f_{1i},f_{2i} \right)$
因为(25) $\boldsymbol{E}_L$ 的结构天然地将对应的 $y_i$ 和 $z_i$ 联系在一起。
另外一个很重要的信息就是y和z正确配对后有 $\boldsymbol{e}_L\bot \boldsymbol{U}_n$ ,所以只需要最大化下面的式子就可以找到对应的2D频率——
$Maximize\longrightarrow \,\,\frac{1}{\sum_{i=I+1}^{\min}{||\boldsymbol{u}_{i}^{H}\boldsymbol{e}_L\left( f_1,f_2 \right) ||}} \left( 39 \right)$

matrix pencil

Matrix pencil在Gene H.Golub教授的《Matrix Computations》²中的描述如下：

If $A,B\in \mathbb{C} ^{n\times n}$ ，then the set of all matrices of the form $A-\lambda B$ with $\lambda\in \mathbb{C}$ is a ${\color{red} pencil}$ .
The ${\color{blue} generalized\,\,eigenvalues}$ of $A-\lambda B$ are elements of the set $\lambda \left( A,B \right)$ defined by
$\lambda \left( A,B \right) =\left\{ z\in \mathbb{C} :\det \left( A-zB \right) =0 \right\}$
If $\lambda \in \lambda \left( A,B \right) \,\,and\,\,0\ne x\in \mathbb{C} ^n\,\,satisfies$ .
$Ax=\lambda Bx$
Then $x$ is an ${\color{blue} eigenvector}$ of $A-\lambda B$ .

矩阵铅笔方法可以看成将两个矩阵以某种方式重构使得需要估计的参数等于矩阵铅笔的秩的减少数(如广义特征值)。

提取 $y_i$

假设充分条件(29)可以被满足，则 $range\left( \boldsymbol{U}_s \right) =range\left( \boldsymbol{E}_L \right)$ ，于是
有且仅有唯一一个 $I\times I$ 的非奇异矩阵 $\boldsymbol{T}$ ,使得 $\boldsymbol{U}_s=\boldsymbol{E}_L\boldsymbol{T}.$ $\boldsymbol{T}$ 的唯一性可以由 $\boldsymbol{U}_s$ 与 $\boldsymbol{E}_L$ 列满秩(均包含独立的 $I$ 列)得到。
$\left\{ \begin{array}{c} \boldsymbol{U}_1=\boldsymbol{U}_s\,\,\text{但是不包含}U_s\text{的最后}L\text{行}\\ \boldsymbol{U}_2=\boldsymbol{U}_s\text{但是不包含}U_s\text{的开头}L\text{行}\\ \end{array} \right. \left\{ \begin{array}{c} \boldsymbol{U}_1=\boldsymbol{E}_1\boldsymbol{T}\\ \boldsymbol{U}_2=\boldsymbol{E}_1\boldsymbol{Y}_d\boldsymbol{T}\\ \end{array} \right.$
$\boldsymbol{U}_2$ 和 $\boldsymbol{U}_1$ 构成的矩阵铅笔包含了
$\boldsymbol{U}_2-\lambda \boldsymbol{U}_1=\boldsymbol{E}_1\left( \boldsymbol{Y}_d-\lambda \boldsymbol{I} \right) \boldsymbol{T}$
所以满足 $\boldsymbol{U}_2-\lambda \boldsymbol{U}_1=0$ 的广义特征值就是
$\boldsymbol{Y}_d=\mathrm{diag}\left[ y_1,y_2,\cdots ,y_I \right] 。$
也就是说 $y_i$ 就是矩阵铅笔 $\boldsymbol{U}_2-\lambda \boldsymbol{U}_1$ 减少的秩(因为当 $\lambda _i=y_i$ 矩阵铅笔的秩就会减一)。上述推理要求矩阵 $\boldsymbol{E}_1$ 和 $\boldsymbol{T}$ 均列满秩为 $I$ .

提取 $z_i$

矩阵 $\boldsymbol{P}$ 将 $\boldsymbol{E}_L$ 重排成 $\boldsymbol{E}_{LP}$ ，于是将 $\boldsymbol{U}_s$ 重排成 $\boldsymbol{U}_{sP}$
$\boldsymbol{U}_{sP}=\boldsymbol{PU}_s \\ \left\{ \begin{array}{c} \boldsymbol{U}_{1P}=\boldsymbol{U}_{sP}\,\,\text{但是不包含}\boldsymbol{U}_{sP}\text{的最后}K\text{行}\\ \boldsymbol{U}_{2P}=\boldsymbol{U}_{sP}\text{但是不包含}\boldsymbol{U}_{sP}\text{的开头}K\text{行}\\ \end{array} \right. \\ \boldsymbol{U}_{2P}-\lambda \boldsymbol{U}_{1P}=\boldsymbol{E}_{1P}\left( \boldsymbol{Z}_d-\lambda \boldsymbol{I} \right) \boldsymbol{T}$
所以满足 $\boldsymbol{U}_{2P}-\lambda \boldsymbol{U}_{1P}=0$ 的广义特征值就是

$\boldsymbol{Z}_d=\mathrm{diag}\left[ z_1,z_2,\cdots ,z_I \right].$

$K$ 和 $L$ 满足的条件

$\left\{ \begin{array}{c} r\left( \boldsymbol{E}_1 \right) =I\longrightarrow \left\{ \begin{array}{c} K-1\geqslant I\,\,\\ L\geqslant I\\ \end{array} \right.\\ r\left( \boldsymbol{E}_{1P} \right) =I\longrightarrow \left\{ \begin{array}{c} K\geqslant I\,\,\\ L-1\geqslant I\\ \end{array} \right.\\ \end{array} \right. \left( 40 \right)$
结合(40)和(29)得到MEMP的总体充分条件：
$\left\{ \begin{array}{c} M-I+1>K\geqslant I+1\\ N-I+1\geqslant L-I+1\\ \end{array} \right. \left( 41 \right)$

必要条件是
$\left\{ \begin{array}{c} \left( K-1 \right) L\geqslant I\\ K\left( L-1 \right) \geqslant I\\ \left( M-K+1 \right) \left( N-L+1 \right) \geqslant I\\ \end{array} \right. \left( 42 \right)$

2D 匹配pairing

现在可以通过matrix pencil构造出2D频率就是 $\boldsymbol{U}_2-\lambda \boldsymbol{U}_1$ 和
$\boldsymbol{U}_{2P}-\lambda \boldsymbol{U}_{1P}$ 的广义特征值，但不一定是对应匹配的。
(39)表明，对于 $I$ 组2D频率pair，我们应该要

$Minimize\longrightarrow J_n\left( i,j \right) =\,\,\sum_{i=I+1}^{\min}{||\boldsymbol{u}_{i}^{H}\boldsymbol{e}_L\left( y_i,z_j \right) ||^2}\left( 43 \right)$
由SVD特性，
$Maximize\longrightarrow J_n\left( i,j \right) =\,\,\sum_{i=1}^I{||\boldsymbol{u}_{i}^{H}\boldsymbol{e}_L\left( y_i,z_j \right) ||^2}\left( 44 \right)$
所以遍历 $y_i$ 和 $z_i$ 使得(44)满足即可。

总结

Y. Hua, “Estimating two-dimensional frequencies by matrix enhancement and matrix pencil,” in IEEE Transactions on Signal Processing, vol. 40, no. 9, pp. 2267-2280, Sept. 1992, doi: 10.1109/78.157226. ↩︎
Matrix Computations - 4th Edition. Gene H.Golub ↩︎