解耦原子范数最小化(Decoupled Atomic Norm Minimization)

大灰煜

已于 2022-04-11 15:30:55 修改

阅读量2.1k

点赞数 4

分类专栏：文献阅读笔记文章标签： DOA估计原子范数最小化科研笔记

于 2022-04-11 12:47:47 首次发布

本文链接：https://blog.csdn.net/qq_43553032/article/details/124083906

版权

文献阅读笔记专栏收录该内容

3 篇文章 10 订阅

订阅专栏

文章目录

解耦原子范数最小化
- 解耦原子范数最小化(DANM)的产生
- 转化为SDP问题
SDP问题转化的证明
参考文献和博客

解耦原子范数最小化

解耦原子范数最小化(DANM)的产生

首先，定义一个矩阵形式（与其对应的是向量形式）的原子集：
$\mathcal{A}=\{\boldsymbol{a}_x(\theta)\boldsymbol{a}_y^H(\theta):\theta\in[-\frac{\pi}{2},\frac{\pi}{2}],\boldsymbol{a}_x(\theta)\in\mathbb{C}^{N\times1},\boldsymbol{a}_y(\theta)\in\mathbb{C}^{M\times1}\}$
在DOA估计问题中， $\boldsymbol{a}_x(\theta),\boldsymbol{a}_y(\theta)$ 分别表示两条阵列的方向向量， $\boldsymbol{Z}\in\mathbb{C}^{N\times M}$ 往往表示两个阵列的互协方差矩阵。那么，具体的解耦原子范数为：
$\|\boldsymbol{Z}\|_\mathcal{A}=\inf\{\sum_{k}|s_k|:\boldsymbol{Z}=\sum_{k}s_k\boldsymbol{a}_x(\theta_k)\boldsymbol{a}_y^H(\theta_k),\boldsymbol{a}_x(\theta_k)\boldsymbol{a}_y^H(\theta_k)\in\mathcal{A}\}$
与 $l_1$ 原子范数最小化(ANM)类似，解耦原子范数最小化问题表述为：
$\min_{\boldsymbol{Z}}\|\boldsymbol{Z}\|_{\mathcal{A}} \\ s.t \quad \|\boldsymbol{Z}-\boldsymbol{\hat{Z}}\| \leq \eta$
该问题可以转换为半正定规划(SDP)问题。

转化为SDP问题

证明内容在下一节，转化后的SDP问题表述为：
在这里插入图片描述

转化为该SDP问题的过程中，有以下前提（达到其中一个就可），是不可忽略的。
$\Delta_x = \min_{i\ne j}|f_{x,i}-f_{x,j}| \geq \frac{1}{\lfloor(N-1)/4\rfloor} \\ \Delta_y = \min_{i\ne j}|f_{y,i}-f_{y,j}| \geq \frac{1}{\lfloor(M-1)/4\rfloor}$
在上式中，第k个信号在x阵列和y阵列上相邻的阵元间产生的相位差分别为： $2\pi f_{x,k}$ 和 $2\pi f_{x,k}$ ，其方向向量亦可表述为： $\boldsymbol{a}_x(f_k)$ 和 $\boldsymbol{a}_y(f_k)$ 。 $\mathcal{T}(\boldsymbol{z})$ 表示以向量 $\boldsymbol{z}$ 产生一个同尺寸的Hermitian-Toeplitz矩阵。

SDP问题转化的证明

在忽略变量 $\boldsymbol{Z}$ 的情况下，定义目标函数为：
$g(\boldsymbol{z}_1,\boldsymbol{z}_2)=\frac{1}{2\sqrt{MN}}\left(Tr(\mathcal{T}(\boldsymbol{z}_1))+Tr(\mathcal{T}(\boldsymbol{z}_2))\right)$
其中，
$(\boldsymbol{z}_1,\boldsymbol{z}_2)\in \mathcal{S}_{\boldsymbol{Z}}^{+}=\left\{(\boldsymbol{z}_1,\boldsymbol{z}_2): \begin{bmatrix} \mathcal{T}(\boldsymbol{z}_2) & \boldsymbol{Z}^H \\ \boldsymbol{Z} & \mathcal{T}(\boldsymbol{z}_1) \end{bmatrix} \succeq 0 \right\}$
所以，要证明以上优化问题的等效，只需证明以下等式即可。
$g^{*}=\min_{(\boldsymbol{z}_1,\boldsymbol{z}_2)\in \mathcal{S}_{\boldsymbol{Z}}^{+}}g(\boldsymbol{z}_1,\boldsymbol{z}_2)=\|\boldsymbol{Z}\|_{\mathcal{A}}$
先证明 $g^{*}\leq \|\boldsymbol{Z}\|_{\mathcal{A}}$ 成立。

引理1：如果数据矩阵 $\boldsymbol{Z}\in\mathbb{C}^{N\times M}$ 在 $f$ 上足够可分，即在原子集 $\mathcal{A}$ 中，有足够多的原子 $\boldsymbol{a}_x(f)\boldsymbol{a}^H_y(f)$ 。那么，当数据矩阵 $\boldsymbol{Z}$ 确定时，它就有唯一的稀疏原子分解。在此情况下，得到了：
$\|\boldsymbol{Z}\|_{\mathcal{A}} = \sum_{k}|s_k|$

在引理1的条件下，直接写出数据矩阵 $\boldsymbol{Z}$ 的唯一原子分解为：
$\boldsymbol{Z}=\sum_{k}s_k\boldsymbol{a}_x(f_k)\boldsymbol{a}^H_y(f_k)$
直接构造矩阵 $\mathcal{T}(\boldsymbol{\tilde{z}}_1)$ 和 $\mathcal{T}(\boldsymbol{\tilde{z}}_2)$ ：
$\mathcal{T}(\boldsymbol{\tilde{z}}_1) = \sum_{k}{\sqrt{\frac{M}{N}}|s_k|\boldsymbol{a}_x(f_k)\boldsymbol{a}^H_x(f_k)} \\ \mathcal{T}(\boldsymbol{\tilde{z}}_2) = \sum_{k}{\sqrt{\frac{N}{M}}|s_k|\boldsymbol{a}_y(f_k)\boldsymbol{a}^H_y(f_k)}$
显然，它们都是Hermitian-Toeplitz矩阵，分别将 $\boldsymbol{Z},\mathcal{T}(\boldsymbol{\tilde{z}}_1),\mathcal{T}(\boldsymbol{\tilde{z}}_2)$ 代入约束条件中，得到：
$\begin{bmatrix} \mathcal{T}(\boldsymbol{\tilde{z}}_2) & \boldsymbol{Z}^H \\ \boldsymbol{Z} & \mathcal{T}(\boldsymbol{\tilde{z}}_1) \end{bmatrix} = \sum_{k}\frac{|s_k|}{\sqrt{MN}}\begin{bmatrix} \sqrt{N}\boldsymbol{a}_y(f_k) \\ sign(s_k)\sqrt{M}\boldsymbol{a}_x(f_k)\end{bmatrix} {\begin{bmatrix} \sqrt{N}\boldsymbol{a}_y(f_k) \\ sign(s_k)\sqrt{M}\boldsymbol{a}_x(f_k)\end{bmatrix}}^H \succeq 0$
上式成立，说明向量 $\boldsymbol{\tilde{z}}_1$ 和 $\boldsymbol{\tilde{z}}_2$ 是 $g(\boldsymbol{z}_1,\boldsymbol{z}_2)$ 的一组可行解，代入目标函数中，得到：
$g(\boldsymbol{\tilde{z}}_1,\boldsymbol{\tilde{z}}_2)=\frac{1}{2\sqrt{MN}}\left(Tr(\mathcal{T}(\boldsymbol{\tilde{z}}_1))+Tr(\mathcal{T}(\boldsymbol{\tilde{z}}_2))\right)=\sum_{k}|s_k|$
巧了， $\sum_{k}|s_k|=\|\boldsymbol{Z}\|_{\mathcal{A}}$ 刚好成立， $g$ 的可行解对应着 $\|\boldsymbol{Z}\|_{\mathcal{A}}$ ，那么， $g$ 的最优解 $g^*$ 必然小于可行解，即：
$g^*\leq g(\boldsymbol{\tilde{z}}_1,\boldsymbol{\tilde{z}}_2) = \|\boldsymbol{Z}\|_{\mathcal{A}}$
得证。

接下来，再证明 $g^{*}\geq \|\boldsymbol{Z}\|_{\mathcal{A}}$ 成立。
此时，引入一个新的原子集，叫做“多测量向量(MMV)原子集”，它有如下的定义：
$\mathcal{A_x}=\{\boldsymbol{a}_x(f)\boldsymbol{e}^H_M:\forall f\in [0,1],\forall \boldsymbol{e}_M\in\mathbb{C}^{M\times 1},\|\boldsymbol{e}_M\|=1 \}$
对于MMV问题，它有以下有用的结论：

引理2：对于任意的一个能够在MMV原子集上线性可分的数据矩阵 $\boldsymbol{Z}\in \mathbb{C}^{N\times M}$ ，它在 $\mathcal{A_x}$ 上的原子范数可由以下SDP问题算出：
$\|\boldsymbol{Z}\|_{\mathcal{A_x}}=\min_{\boldsymbol{V},\boldsymbol{z}}\left\{\frac{1}{2\sqrt{N}}(Tr(\boldsymbol{V})+Tr(\mathcal{T}(\boldsymbol{z}))) \right\} \quad s.t \begin{bmatrix} \boldsymbol{V} & \boldsymbol{Z}^H \\ \boldsymbol{Z} & \mathcal{T}(\boldsymbol{z}) \end{bmatrix} \succeq 0$
其中， $\boldsymbol{V}\in \mathbb{C}^{M\times M}$ 是一个Hermitian矩阵， $\mathcal{T}(\boldsymbol{z})\in \mathbb{C}^{N\times N}$ 是一个Toeplitz矩阵。

引理3：如果 $\boldsymbol{Z}=\sum_{k}s_k\boldsymbol{a}_x(f_k)\boldsymbol{e}^H_M$ ， $\boldsymbol{a}_x(f_k)\boldsymbol{e}^H_M$ 是MMV集合中的原子，满足以下的频率可分条件：
$\Delta_x = \min_{i\ne j}|f_{x,i}-f_{x,j}|\geq \frac{1}{\lfloor(N-1)/4\rfloor}$
那么，就可以保证：
$\|\boldsymbol{Z}\|_{\mathcal{A_x}}=\sum_{k}|s_k|$
这一点也正好对应了转换成SDP问题的前提条件。

有了这两个引理做铺垫，我们就可以完成证明。
不失一般性的，我们考虑x轴满足前提条件：
$\Delta_x = \min_{i\ne j}|f_{x,i}-f_{x,j}|\geq \frac{1}{\lfloor(N-1)/4\rfloor}$
根据引理1，在解耦原子范数集 $\mathcal{A}$ 下，它有唯一的分解为：
$\begin{aligned} \boldsymbol{Z}=\sum_{k}s_k\boldsymbol{a}_x(f_k)\boldsymbol{a}^H_y(f_k)&=\sum_{k}s_k\|\boldsymbol{a}^H_y(f_k)\|_2\boldsymbol{a}_x(f_k)\frac{\boldsymbol{a}^H_y(f_k)}{\|\boldsymbol{a}^H_y(f_k)\|_2} \\ &= \sum_{k}(\sqrt{M}s_k)\boldsymbol{a}_x(f_k)\frac{\boldsymbol{a}^H_y(f_k)}{\|\boldsymbol{a}^H_y(f_k)\|_2} \end{aligned}$
显然， $\frac{\boldsymbol{a}_x(f_k)\boldsymbol{a}^H_y(f_k)}{\|\boldsymbol{a}^H_y(f_k)\|_2} \in \mathcal{A_x}$ 。另外，由于引理3，所以可以将其MMV原子范数表示为：
$\|\boldsymbol{Z}\|_{\mathcal{A_x}}=\sqrt{M}\sum_{k}|s_k|$
同时，
$\|\boldsymbol{Z}\|_{\mathcal{A}}=\sum_{k}|s_k|$
因此，数据矩阵 $\boldsymbol{Z}$ 的两种原子范数的联系就建立起来了：
$\|\boldsymbol{Z}\|_{\mathcal{A}}=\frac{1}{\sqrt{M}}\|\boldsymbol{Z}\|_{\mathcal{A_x}}$
由于引理2，那么，取 $\boldsymbol{V}=\mathcal{T}(\boldsymbol{z_2})$ ， $\boldsymbol{z}=\boldsymbol{z_1}$ ，
$\begin{aligned} \|\boldsymbol{Z}\|_{\mathcal{A}}=&\min_{\boldsymbol{z_1},\boldsymbol{z_2}}\left\{\frac{1}{2\sqrt{MN}}(Tr(\mathcal{T}(\boldsymbol{z_1}))+Tr(\mathcal{T}(\boldsymbol{z_2}))) \right\}=\min_{\boldsymbol{z_1},\boldsymbol{z_2}}{g(\boldsymbol{z_1},\boldsymbol{z_2})} \\ \leq & \{g(\boldsymbol{\tilde{z}}_1,\boldsymbol{\tilde{z}}_2):(\boldsymbol{\tilde{z}}_1,\boldsymbol{\tilde{z}}_2) \in \mathcal{S}_{\boldsymbol{Z}}^{+}\} \end{aligned}$
上式最后一项是可行解对应的目标集，由于 $g^*$ 也是可行解对应的目标之一，所以，
$\|\boldsymbol{Z}\|_{\mathcal{A}} \leq g^*$
证毕。

$\min_{(\boldsymbol{z}_1,\boldsymbol{z}_2)\in \mathcal{S}_{\boldsymbol{Z}}^{+}}g(\boldsymbol{z}_1,\boldsymbol{z}_2)=\|\boldsymbol{Z}\|_{\mathcal{A}}$
结论得证。因而，当数据矩阵 $\boldsymbol{Z}$ 不确定时，关于它的优化问题等价为：
$\min_{\boldsymbol{Z}}\min_{(\boldsymbol{z}_1,\boldsymbol{z}_2)\in \mathcal{S}_{\boldsymbol{Z}}^{+}}g(\boldsymbol{z}_1,\boldsymbol{z}_2)=\min_{\boldsymbol{Z}}\|\boldsymbol{Z}\|_{\mathcal{A}}=\min_{\boldsymbol{z}_1,\boldsymbol{z}_2,\boldsymbol{Z}}g(\boldsymbol{z}_1,\boldsymbol{z}_2) \quad s.t \begin{bmatrix} \mathcal{T}(\boldsymbol{z}_2) & \boldsymbol{Z}^H \\ \boldsymbol{Z} & \mathcal{T}(\boldsymbol{z}_1) \end{bmatrix} \succeq 0$
等价问题得证。