【压缩感知合集9】压缩感知的OMP算法（算法步骤分析、举例分析、说明总结和缺陷）

呆呆象呆呆

已于 2022-12-04 11:12:01 修改

阅读量2.4w

点赞数 113

分类专栏：理论知识学习文章标签：算法 python 人工智能

于 2021-07-25 17:25:13 首次发布

本文链接：https://blog.csdn.net/qq_41554005/article/details/119084654

版权

理论知识学习专栏收录该内容

50 篇文章

订阅专栏

0 前情提要

0.1 数学模型和总体框图如下

给定输入信号 $\boldsymbol{X} \in \mathbb{R}^{N\times1}$ ，最终想要得到压缩信号 $\boldsymbol{A} \in \mathbb{R}^{M\times1}$ ， $K < < N$

0.2 压缩过程图例分析如下

整个压缩过程也可以被称为感知过程
$\boldsymbol{A} =\boldsymbol{\Phi}\boldsymbol{X} = \boldsymbol{\Phi}\boldsymbol{\Psi} \boldsymbol{Y} = \boldsymbol{\Theta}\boldsymbol{Y}$

$\boldsymbol{\Theta}$ 即为感知过程的核心命名为感知矩阵

符号	含义	维度	属性
$\boldsymbol{X}$	输入信号；待压缩信号	$\mathbb{R}^{N\times1}$	未知，需要恢复
$\boldsymbol{\Phi}$	观测矩阵；测量矩阵	$\mathbb{R}^{M \times N}$	已知（非自适应性）
$\boldsymbol{\Psi}$	变换矩阵；变换基矩阵；稀疏基矩阵；稀疏矩阵；正交基字典矩阵	$\mathbb{R}^{N\times N}$	已知（非自适应性）
$\boldsymbol{Y}$	正交基变换后的稀疏表示	$\mathbb{R}^{N\times1}$	未知，需要恢复
$\boldsymbol{\Theta}$	感知矩阵，传感矩阵	$\mathbb{R}^{M\times N}$	已知（非自适应性）
$\boldsymbol{A}$	观测压缩所得到压缩信号	$\mathbb{R}^{M\times1}$	已知

0.3 算法重构恢复过程如下

在得到已经压缩完的采样信号 $\boldsymbol{A}$ 后，根据确定的固定性观测矩阵 $\boldsymbol{\Phi}$ 和稀疏矩阵 $\boldsymbol{\Psi}$ 的先验信息进行恢复，数学表达如下
$\boldsymbol{\check{X}}=f(\boldsymbol{A},\boldsymbol{\Theta})$
给定被压缩的信号 $\boldsymbol{A}$ 和感知矩阵 $\boldsymbol{\Theta}$ ，求解输入原始信号 $\boldsymbol{\check{X}}$ 的过程称为重构。

重构问题相较于压缩问题来说是一个更加困难的一个任务。

由于 $M < < N$ ，已知条件所能构成的方程是欠定的，无法轻易求出数值解的，幸运的是，如果原始信号是稀疏的，那么这个问题可以被很好地解决。

解释一下为什么是欠定的：（ $\boldsymbol{X}$ 满足的约束如下）
$\boldsymbol{A} = \boldsymbol{\Psi}\boldsymbol{X}\\ \left[\begin{array}{c}a_1 \\ \vdots\\ a_M \end{array}\right] = \left[\begin{array} {cccc} \psi_{11} & \psi_{12} & ... & \psi_{1N} \\\psi_{2N} & \psi_{2N} &... &\psi_{2N}\\ \vdots & \vdots & \vdots & \vdots \\ \psi_{M1} & \psi_{M2} &... &\psi_{MN}\end{array}\right]\left[\begin{array}{c}x_1 \\ x_2 \\ \vdots \\ x_N\end{array}\right]$
实际使用过程中需要求解出 $N$ 个未知数，但是只有 $M$ 个方程，未知数的个数远远大于方程的个数。

若 $N = M$ ，则可轻松由 $\boldsymbol{A}$ 解出 $\boldsymbol{X}$ 和 $\boldsymbol{Y}$

而 $M < < N$ ，可根据稀疏表示下的信号 $\boldsymbol{Y}$ 和矩阵所具有的RIP性质重构

一般可以抽象为如下求解任务
$\min \left\| \boldsymbol{\Psi}^{T} \boldsymbol{X}\right\|_{0} \\s.t. \boldsymbol{\Theta} \boldsymbol{X}=\boldsymbol{\Phi}\boldsymbol{\Psi}\boldsymbol{X}= \boldsymbol{A}$

1 正交匹配跟踪算法（OMP）

1.0 问题设置

考虑以下情况，给定 $\boldsymbol{X}=\left[\begin{array}{c}-1.2 \\ 1 \\ 0\end{array}\right]$ 和 $\boldsymbol{D}=\left[\begin{array}{ccc}-0.707 & 0.8 & 0 \\ 0.707 & 0.6 & -1\end{array}\right]$ ，

我们可以计算 $\boldsymbol{A} = \boldsymbol{D}\boldsymbol{X}$ ，这是非常简单地，也就是
$\boldsymbol{A} = \boldsymbol{D}\boldsymbol{X}=\left[\begin{array}{ccc}-0.707 & 0.8 & 0 \\ 0.707 & 0.6 & -1\end{array}\right]\left[\begin{array}{c}-1.2 \\ 1 \\ 0\end{array}\right]=\left[\begin{array}{c}1.65 \\ -0.25\end{array}\right]$
现在让我们介绍比较难的部分，给定 $\boldsymbol{A} = \left[\begin{array}{c}1.65 \\ -0.25\end{array}\right]$ 和 $\boldsymbol{D}=\left[\begin{array}{ccc}-0.707 & 0.8 & 0 \\ 0.707 & 0.6 & -1\end{array}\right]$ ，如何找到最接近的 $\boldsymbol{X}$ ？

解释一下为什么是欠定的：
$\begin{aligned} \boldsymbol{A}&= \boldsymbol{D}\boldsymbol{X}\\ \left[\begin{array}{c}1.65 \\ -0.25\end{array}\right] &= \left[\begin{array}{ccc}-0.707 & 0.8 & 0 \\ 0.707 & 0.6 & -1\end{array}\right]\left[\begin{array}{c}x_1 \\ x_2 \\ x_3\end{array}\right] \end{aligned}$
例子中需要求解出3个未知数，但是只有2个方程

实际使用过程中需要求解的未知数有 $N$ 个，但是只有 $M$ 个方程，未知数的个数远远大于方程的个数 $M < < N$ 。

1.1 步骤描述

输入：字典矩阵 $\boldsymbol{D}$ ，采样所得向量 $\boldsymbol{A}$ ，稀疏度 $K$

输出： $\boldsymbol{X}$ 的 $K$ 稀疏逼近 $\boldsymbol{\check{X}}$

初始化：残差 $\boldsymbol{f}_0=\boldsymbol{A}$ ，索引集 $Λ_0=\varnothing$ ， $t = 1$

循环执行步骤1-5：

找出残差 $\boldsymbol{f}_t$ 和字典矩阵的列 $\boldsymbol{d}_{r_t}$ 内积中最大值所对应的脚标 $r_t$ ，即 $r_i=\arg\max_{r_t=1,⋯,N}|\langle\boldsymbol{f},\boldsymbol{d}_{r_t}\rangle|$
更新索引集 $Λ_t=Λ_{t−1}∪{r_t}$ ，记录找到的字典矩阵中的重建原子集合 $\boldsymbol{D}_t =\left[ \boldsymbol{D}_{t-1},\boldsymbol{d}_{r_t}\right]$
由最小二乘得到 $\boldsymbol{\check{X}} = \arg \min_{\boldsymbol{w}}\|\boldsymbol{A}−\boldsymbol{D}_t\boldsymbol{w}\|$
更新残差 $\boldsymbol{f}_t = \boldsymbol{A}−\boldsymbol{A}_t\boldsymbol{\check{X}}$ ， $t = t + 1$
判断是否满足 $t > K$ ，若满足，（或者判断残差的大小）则迭代停止；若不满足，则继续循环

1.2 匹配追踪的概念

这一部分是和MP算法相同的，正好也在此说明匹配追踪的算法。

字典由一系列基信号或者原子组成的，也就是说
$\boldsymbol{D}=\left[\begin{array}{ccc} -0.707 & 0.8 & 0 \\ 0.707 & 0.6 & -1 \end{array}\right]=\left[\begin{array}{c} \boldsymbol{d}_1, \boldsymbol{d}_2, \boldsymbol{d}_3 \end{array}\right]$
其中，
$\boldsymbol{d}_1=\left[\begin{array}{c} -0.707 \\ 0.707 \end{array}\right], \quad \boldsymbol{d}_2=\left[\begin{array}{c} 0.8 \\ 0.6 \end{array}\right], \quad \boldsymbol{d}_3=\left[\begin{array}{c} 0 \\ -1 \end{array}\right]$
被称为原子或者基信号。

现在我们将基信号表达出来
$\begin{aligned} \boldsymbol{A} &= \boldsymbol{D}\boldsymbol{X}=\left[\begin{array}{ccc}-0.707 & 0.8 & 0 \\0.707 & 0.6 & -1\end{array}\right] \left[\begin{array}{c}x_1 \\ x_2 \\ x_3 \end{array}\right] =\left[\begin{array}{c} x_1\boldsymbol{d}_1, x_2\boldsymbol{d}_2, x_3\boldsymbol{d}_3 \end{array}\right]\\ &=\left[\begin{array}{c}-0.707 \\0.707\end{array}\right]x_1+ \left[\begin{array}{c}0.8 \\0.6\end{array}\right]x_2+ \left[\begin{array}{c}0 \\-1\end{array}\right]x_3 \end{aligned}$
上面的方程说明了 $\boldsymbol{A}$ 是 $\boldsymbol{D}$ 中原子的线性组合，而线性组合系数恰好是 $\boldsymbol{X}$ 。实际上，我们知道 $x_1=-1.2, x_2=1, x_3=0$ ，换句话说原子 $\boldsymbol{d}_1$ 对于 $\boldsymbol{A}$ 贡献了 $- 1.2$ ， $\boldsymbol{d}_2$ 对于 $\boldsymbol{A}$ 贡献了 $1$ ， $\boldsymbol{d}_3$ 对于 $\boldsymbol{A}$ 贡献了 $0$ 。

MP算法和OMP算法要找到对 $\boldsymbol{A}$ 贡献最大的那个原子，然后是贡献次之的原子，一直进行到贡献最小的原子。

第一步：求取最大相关

在矩阵A中有三个原子，
$\boldsymbol{d}_1=\left[\begin{array}{c}-0.707 \\0.707\end{array}\right], \quad \boldsymbol{d} 2=\left[\begin{array}{c}0.8 \\0.6\end{array}\right], \quad \boldsymbol{d} 3=\left[\begin{array}{c}0 \\-1\end{array}\right]$
压缩信号 $\boldsymbol{A} = \left[\begin{array}{c}1.65 \\ -0.25\end{array}\right]$

我们计算每个原子对于 $\boldsymbol{A}$ 的贡献（主要是点乘计算投影的大小）
$\begin{aligned} \langle \boldsymbol{d}_1, \boldsymbol{A}\rangle &=\left[\begin{array}{c} -0.707 \\0.707\end{array}\right]\left[\begin{array}{c}1.65 \\-0.25\end{array}\right]=-0.707 \times 1.65+0.707 \times(-0.25)=-1.34\\ \langle \boldsymbol{d}_2, \boldsymbol{A}\rangle&=\left[\begin{array}{c}0.8 \\0.6\end{array}\right]\left[\begin{array}{c}1.65 \\-0.25 \end{array}\right]=0.8 \times 1.65+0.6 \times(-0.25)=1.17\\ \langle \boldsymbol{d}_3, \boldsymbol{A}\rangle&=\left[\begin{array}{c}0 \\-1\end{array}\right]\left[\begin{array}{c}1.65 \\-0.25 \end{array}\right]=0 \times 1.65+(-1) \times(-0.25)=0.25 \end{aligned}$

根据上述结果，可以看出 $\boldsymbol{d}_1$ 对于 $\boldsymbol{A}$ 的贡献最大，值为 $- 1.34$ （这里只考虑大小，不用管负号，负号只是代表方向相反。我也想说下自己对于这块的理解，这里使用的是点积（内积），求的是 $\boldsymbol{A}$ 和 $\boldsymbol{D}$ 中每个原子的相关性）。当然也可以使用一步矩阵相乘直接计算出贡献
$\boldsymbol{w} =\boldsymbol{D}^{T} \boldsymbol{A}=\left[\begin{array}{ccc} -0.707 & 0.707 \\ 0.8 & 0.6 \\ 0 & -1 \end{array}\right]\left[\begin{array}{c} 1.65 \\ -0.25 \end{array}\right]=\left[\begin{array}{c} -1.34 \\ 1.17 \\ 0.25 \end{array}\right]$
可以得到相同的结果，下图展示了 $\boldsymbol{D}$ 中的原子 $\boldsymbol{d}_1,\boldsymbol{d}_2,\boldsymbol{d}_3$ 和 $\boldsymbol{A}$ ，从图中可以看出来 $\boldsymbol{d}_1$ 的负向和 $\boldsymbol{A}$ 是最接近的，意味着贡献最大最相关。

第二步：求取残差

根据上一节中的计算结果，我们选择贡献最大的原子 $\boldsymbol{d}_1=\left[\begin{array}{c}-0.707 \\0.707\end{array}\right]$ ，相关的系数是 $\langle \boldsymbol{d}_1, \boldsymbol{A}\rangle=-1.34$ ，如果我们从 $\boldsymbol{A}$ 中减去，那么剩余的残差是
$\boldsymbol{f}=\boldsymbol{A}-\langle \boldsymbol{d}_1, \boldsymbol{A}\rangle \boldsymbol{d}_1=\left[\begin{array}{c} 1.65 \\-0.25\end{array}\right]-(-1.34)\left[\begin{array}{c}-0.707 \\0.707\end{array}\right]=\left[\begin{array}{c}0.7 \\0.7\end{array}\right]$
那么所得的残差由什么意义呢？从 $\boldsymbol{A}$ 中减去了所有与原子 $\boldsymbol{d}_1$ 有关的信息，为什么说是所有呢，因为刚才计算的系数同时也代表着投影的意义， $\boldsymbol{A}$ 减去这个长度的投影，所剩残差 $\boldsymbol{f}$ 与 $\boldsymbol{d}_1$ 正交，也表示残差不能再由 $\boldsymbol{d}_1$ 线性表示。

第三步：重复迭代

在第一次迭代时，我们选择了原子 $\boldsymbol{d}_1$ ，将其作为一个基放入新的压缩矩阵 $\boldsymbol{D}_\text{new}$ 中，也就是 $\boldsymbol{D}_{\text{new}}=[\boldsymbol{d}_1]=\left[\begin{array}{c}-0.707 \\0.707\end{array}\right]$ ，并且将贡献系数写入到重构信号 $\boldsymbol{\check{X}}$ 中， $\boldsymbol{\check{X}}=\left[\begin{array}{c}-1.34 \\0 \\0\end{array}\right]$ ， $- 1.34$ 被放置到第一个元素的位置是因为这个贡献系数来自于 $\boldsymbol{D}$ 中的第一个基 $\boldsymbol{d}_1$ 。残差 $\boldsymbol{f}$ 计算为 $\boldsymbol{f}=\left[\begin{array}{c}0.7 \\0.7\end{array}\right]$ 。现在我们要从剩余的原子 $\boldsymbol{d}_2$ 或者 $\boldsymbol{d}_3$ 中选择出对残差贡献最大的，
$\boldsymbol{w}=\left[\begin{array}{ccc}\boldsymbol{d}_2 & \boldsymbol{d}_3\end{array}\right]^{T} \boldsymbol{f}=\left[\begin{array}{cc}0.8 & 0.6 \\0 & -1\end{array}\right]\left[\begin{array}{l}0.7 \\0.7\end{array}\right]=\left[\begin{array}{c}0.98 \\-0.7\end{array}\right]$
由于 $\boldsymbol{f}_2$ 的贡献比较大（ $0.98 > 0.7$ ，忽略负号），所以选择 $\boldsymbol{f}_2$ 。

现在我们将已经选择了的基 $\boldsymbol{d}_1,\boldsymbol{d}_2$ 都放到新的压缩矩阵中 $\boldsymbol{D}_{\text{new}}$ ，
$\boldsymbol{D}_{\text{new}}=\left[\begin{array}{cc} \boldsymbol{d}_1 & \boldsymbol{d}_2 \end{array}\right]=\left[\begin{array}{cc} -0.707 & 0.8 \\ 0.707 & 0.6 \end{array}\right]$

第四步：与MP算法不同的OMP算法细节

接下来这一步是与之前提出的另一种方法匹配跟踪算法不同的地方，

计算 $\boldsymbol{D}_{\text{new}}$ 对于 $\boldsymbol{A}$ 的贡献，得到系数（而不是MP中的做法，计算 $\boldsymbol{d}_{r_2}$ ，此时 $\boldsymbol{d}_{r_2}即为\boldsymbol{d}_{2}$ 对残差的贡献，得到系数）。为了得到OMP的新系数，OMP会去解一个最小二乘问题，如下
$w_{1} \cdot\left[\begin{array}{c} -0.707 \\ 0.707 \end{array}\right]+w_{2} \cdot\left[\begin{array}{c} 0.8 \\ 0.6 \end{array}\right] \text { as close as possible to } y=\left[\begin{array}{c} 1.65 \\ -0.25 \end{array}\right]$

写成数学公式如下：
$\min \left\|\boldsymbol{D}_{\text{new}} \boldsymbol{w}-\boldsymbol{A}\right\|_{2}$
在这个例子中，
$\min \left\|\left[\begin{array}{cc} -0.707 & 0.8 \\ 0.707 & 0.6 \end{array}\right] \cdot\left[\begin{array}{c} w_{1} \\ w_{2} \end{array}\right]-\left[\begin{array}{c} 1.65 \\ -0.25 \end{array}\right]\right\|_{2}$

得到 $w_{1} ,w_{2}$ 。我们知道
$\min \left\|\boldsymbol{D}_{\text{new}} \boldsymbol{w}-\boldsymbol{A}\right\|_{2}$

的解是 $\boldsymbol{w}= \boldsymbol{D}_{\text{new}}^{+} \boldsymbol{A}$ ，其中是 $\boldsymbol{D}_{\text{new}}^{+}$ 是 $\boldsymbol{D}_{\text{new}}$ 的伪逆，也就是说 $\boldsymbol{D}_{new}^{+}=\left(\boldsymbol{D}_{new}^{T} \boldsymbol{D}_{new}\right)^{-1} \boldsymbol{D}_{new}^{T}$ ，在我们这个例子中
$\boldsymbol{D}_{n e w}^{+}=\left[\begin{array}{cc} -0.707 & 0.8 \\ 0.707 & 0.6 \end{array}\right]^{+}=\left[\begin{array}{cc} -0.6062 & 0.8082 \\ 0.7143 & 0.7143 \end{array}\right]$
可以在MATLAB中使用pinv()来计算伪逆。计算完伪逆之后，我们得到了
$\boldsymbol{w}=\boldsymbol{D}_\text{new}^{+}\boldsymbol{A}=\left[\begin{array}{cc} -0.6062 & 0.8082 \\ 0.7143 & 0.7143 \end{array}\right]\left[\begin{array}{c} 1.65 \\ -0.25 \end{array}\right]\thickapprox\left[\begin{array}{c} -1.2 \\ 1 \end{array}\right]$
在得到更新后的 $\boldsymbol{D}_{\text{new}}$ 和 $\boldsymbol{w}$ ，我们更新残差
$\boldsymbol{f}=\boldsymbol{A}-\boldsymbol{D}_\text{new}\cdot \boldsymbol{w}\thickapprox\left[\begin{array}{c} 1.65 \\ -0.25 \end{array}\right]-\left[\begin{array}{cc} -0.707 & 0.8 \\ 0.707 & 0.6 \end{array}\right]\left[\begin{array}{c} -1.2 \\ 1 \end{array}\right]\thickapprox\left[\begin{array}{l} 0 \\ 0 \end{array}\right]$
现在我们得到的残差约等于 $0$ ，所以停止迭代。

我们将得到的 $w_{1} ,w_{2}$ 分别放入 $\boldsymbol{\check{X}}$ 中第一和第二个位置，因为它们分别对应了我们选择的第一和第二个原子。接着更新重构信号
$\boldsymbol{\check{X}}=\left[\begin{array}{c} -1.2 \\ 1 \\ 0 \end{array}\right]$

第五步最后一次迭代

因为残差已经为 $0$ ，所以这一步并不是必须的。许多OMP算法需要设置一个关于信号稀疏性的参数 $K$ ，这告诉算法它需要迭代 $K$ 次，即使残差为 $0$ ，也需要迭代 $K$ 次。

1.3 第二个例子说明

给定 $\boldsymbol{X}=\left[\begin{array}{c}0\\3 \\1 \\2\end{array}\right]$ 和 $\boldsymbol{D}=\left[\begin{array}{cccc}-0.8 & 0.3 & 1 & 0.4 \\-0.2 & 0.4 & -0.3 & -0.4 \\0.2 & 1 & -0.1 & 0.8\end{array}\right]$ ，有压缩信号 $\boldsymbol{A}=\boldsymbol{D} \boldsymbol{X}=\left[\begin{array}{l}2.7 \\0.1 \\4.5\end{array}\right]$ ，现在给定 $\boldsymbol{A}$ 和 $\boldsymbol{D}$ ，使用OMP算法求解 $\boldsymbol{X}$ 。

有4个基（原子）：
$\boldsymbol{d}_{1}=\left[\begin{array}{c} -0.8 \\ -0.2 \\ 0.2 \end{array}\right] \quad \boldsymbol{d}_{2}=\left[\begin{array}{c} 0.3 \\ 0.4 \\ 1 \end{array}\right] \quad \boldsymbol{d}_{3}=\left[\begin{array}{c} 1 \\ -0.3 \\ -0.1 \end{array}\right] \quad \boldsymbol{d}_{4}=\left[\begin{array}{c} 0.4 \\ -0.4 \\ 0.8 \end{array}\right]$
由于基向量的长度不是 $1$ ，所以我们首先进行标准化，实现字典矩阵的标准化 $\boldsymbol{D} \rightarrow \hat{\boldsymbol{D}}=\left[\hat{\boldsymbol{d_1}}\hat{\boldsymbol{d_2}}\hat{\boldsymbol{d_3}}\hat{\boldsymbol{d_4}}\right]$ 。

$\hat{\boldsymbol{d}_{1}}=\boldsymbol{d}_{1} /\left\|\boldsymbol{d}_{1}\right\|=\left[\begin{array}{c} -0.8 \\ -0.2 \\ 0.2 \end{array}\right] / \sqrt{(-0.8)^{2}+(-0.4)^{2}+(0.2)^{2}}=\left[\begin{array}{c} -0.9428 \\ -0.2357 \\ 0.2357 \end{array}\right]$

$\hat{\boldsymbol{d}_{2}}=\boldsymbol{d}_{2} /\left\|\boldsymbol{d}_{2}\right\|=\left[\begin{array}{c} 0.2680 \\ 0.3578 \\ 0.8940 \end{array}\right] \\$

$\hat{\boldsymbol{d}_{3}}=\boldsymbol{d}_{3} /\left\|\boldsymbol{d}_{3}\right\|=\left[\begin{array}{c} 0.9535 \\ -0.2860 \\ 0.0953 \end{array}\right] \\$

$\hat{\boldsymbol{d}_{4}}=\boldsymbol{d}_{4} /\left\|\boldsymbol{d}_{4}\right\|=\left[\begin{array}{c} 0.4082 \\ -0.4082 \\ -0.8165 \end{array}\right]$

标准化的字典基向量 $\boldsymbol{d}_{r_{i}}$ 对 $\boldsymbol{A}$ 的贡献
$\begin{aligned} \hat{\boldsymbol{D}}^{\mathrm{T}} \cdot \boldsymbol{A}&=\left[\begin{array}{cccc} -0.9428 & 0.2680 & 0.9535 & 0.4082 \\ -0.2357 & 0.3578 & -0.2860 & -0.4082 \\ 0.2357 & 0.9840 & -0.0953 & -0.8165 \end{array}\right]^{\mathrm{T}} \cdot\left[\begin{array}{c} 2.7 \\ 0.1 \\ 4.5 \end{array}\right] \\ &=\left[\begin{array}{c} -1.5085 \\ 4.7852 \\ 2.1167 \\ 4.7357 \end{array}\right] \end{aligned}$
第二个基向量 $\hat{\boldsymbol{d_2}}$ 贡献值最大，所以将 $\boldsymbol{d_2}$ 加入到 $\boldsymbol{D}_\text{new}$ 中， $\boldsymbol{D}_\text{new} = \left[\boldsymbol{d}_2\right] = \left[\begin{array}{c} 0.3 \\ 0.4 \\ 1 \end{array}\right]$

利用最小二乘法计算 $\boldsymbol{w}$
$\min \left\|\boldsymbol{D}_{\text{new}} \boldsymbol{w}-\boldsymbol{A}\right\|_{2} = \min \left\|\boldsymbol{d}_{2} w_1-\boldsymbol{A}\right\|_{2}$
也就是求解 $w_1 = \boldsymbol{D}_\text{new}^{+}\boldsymbol{A} = 4.28$

因为 $w_1$ 对应着第二个基向量 $\boldsymbol{d}_2$ ，所以 $\boldsymbol{\check{X}}=\left[\begin{array}{c}0\\4.28 \\0 \\0\end{array}\right]$

接下来计算残差
$\boldsymbol{f}=\boldsymbol{A}-\boldsymbol{D}_{\text {new }} \cdot \boldsymbol{w}=\left[\begin{array}{l} 2.7 \\ 0.1 \\ 4.5 \end{array}\right]-\left[\begin{array}{c} 0.3 \\ 0.4 \\ 1 \end{array}\right] \cdot 4.28=\left[\begin{array}{c} 1.416 \\ -1.612 \\ 0.22 \end{array}\right]$
接下来重复计算 $\hat{\boldsymbol{d}_1},\hat{\boldsymbol{d}_3},\hat{\boldsymbol{d}_4}$ 对 $\boldsymbol{f}$ 的贡献

$\left[\hat{\boldsymbol{d}_1}\hat{\boldsymbol{d}_3}\hat{\boldsymbol{d}_4}\right]^{\mathrm{T}} \cdot \boldsymbol{f}=\left[\begin{array}{ccc} -0.9428 & 0.9535 & 0.4082 \\ -0.2357 & -0.2860 & -0.4082 \\ 0.2357 & -0.0953 & -0.8165 \end{array}\right]^{\mathrm{T}} \cdot\left[\begin{array}{c} 1.416 \\ -1.612 \\ 0.22 \end{array}\right]=\left[\begin{array}{c} -0.9032 \\ 1.7902 \\ 1.4158 \end{array}\right]$
选择第二个贡献最大的基 $\hat{\boldsymbol{d}_3}$ ，其贡献值为 $1.7902$

将选择的 $\boldsymbol{d}_3$ 加入到 $\boldsymbol{D}_\text{new}$ 中， $\boldsymbol{D}_\text{new} = \left[\boldsymbol{d}_2\boldsymbol{d}_3\right]$

用最小二乘法计算 $\boldsymbol{w}=\boldsymbol{D}_\text{new}^{+} \cdot \boldsymbol{A}=\left[\begin{array}{l}4.1702 \\ 1.7149\end{array}\right]$

这个 $\boldsymbol{w}$ 对应着 $\boldsymbol{d}_2$ 和 $\boldsymbol{d}_3$ ，因此 $\boldsymbol{\check{X}}=\left[\begin{array}{c}0\\4.1702 \\1.7149 \\0\end{array}\right]$

接着计算残差

$\boldsymbol{f}=\boldsymbol{A}-\boldsymbol{D}_\text{new} \cdot\boldsymbol{w}=\left[\begin{array}{l}2.7 \\ 0.1 \\ 4.5\end{array}\right]-\left[\begin{array}{cc}0.3 & 1 \\ 0.4 & -0.3 \\ 1 & -0.1\end{array}\right] \cdot\left[\begin{array}{c}4.172 \\ 1.7149\end{array}\right]=\left[\begin{array}{c}-0.266 \\ -1.0536 \\ 0.5012\end{array}\right]$
重复计算 $\hat{\boldsymbol{d}_1},\hat{\boldsymbol{d}_4}$ 对 $\boldsymbol{f}$ 的贡献
$\left[\hat{\boldsymbol{d}_1} \hat{\boldsymbol{d}_4}\right] \cdot \boldsymbol{f} =\left[\begin{array}{cc}-0.9428 & 0.4082 \\ -0.2357 & -0.4082 \\ 0.2357 & -0.8165\end{array}\right]^{\mathrm{T}} \cdot\left[\begin{array}{c}-0.266 \\ -1.0536 \\ 0.5012\end{array}\right]=\left[\begin{array}{l}0.6172 \\ 0.7308\end{array}\right]$
选择第三个贡献最大的基 $\hat{\boldsymbol{d}_4}$ ，其贡献值为 $0.7308$

将 $\boldsymbol{d}_4$ 加入到 $\boldsymbol{D}_\text{new}$ 中， $\boldsymbol{D}_\text{new} = \left[\boldsymbol{d}_2 \boldsymbol{d}_3\boldsymbol{d}_4\right]$

利用最小二乘计算权重
$\boldsymbol{w} = \boldsymbol{D}_{\text {new}}^{+} \cdot \boldsymbol{A}=\left[\begin{array}{l} 3 \\ 2 \\ 1 \end{array}\right]$
这个 $\boldsymbol{w}$ 对应着 $\boldsymbol{d}_2,\boldsymbol{d}_3$ 和 $\boldsymbol{d}_4$ ，因此 $\boldsymbol{\check{X}}=\left[\begin{array}{c}0\\3 \\1 \\2\end{array}\right]$

接着计算残差

$\boldsymbol{f}=\boldsymbol{A}-\boldsymbol{D}_\text{new} \cdot \boldsymbol{w}=\left[\begin{array}{c} 2.7 \\ 0.1 \\ 4.5 \end{array}\right]-\left[\begin{array}{ccc} 0.3 & 1 & 0.4 \\ 0.4 & -0.3 & -0.4 \\ 1 & -0.1 & 0.8 \end{array}\right] \cdot\left[\begin{array}{l} 3 \\ 1 \\ 2 \end{array}\right]=\left[\begin{array}{l} 0 \\ 0 \\ 0 \end{array}\right]$
迭代到此为止，因为此时残差已经为 $0$ ，重建的 $\boldsymbol{X}$ 为 $\boldsymbol{\check{X}}=\left[\begin{array}{c}0\\3 \\1 \\2\end{array}\right]$ ，和原来的信号相同。

2 注意事项

在计算最大贡献的时候，字典矩阵 $\boldsymbol{D}$ 中的原子应当是归一化后的，而不是使用归一化前的原子。
在计算贡献时，计算的是残差 $\boldsymbol{f}$ 与矩阵 $\boldsymbol{D}$ 中每个归一化的原子的点积。
在匹配跟踪算法中，重构信号 $\boldsymbol{\check{X}}$ 是通过计算字典基信号 $\boldsymbol{d}_{r_i}$ 和残差 $\boldsymbol{f}$ 的点积得到的，对于正交匹配跟踪算法，重构信号 $\boldsymbol{\check{X}}$ 是通过计算最小二乘解 $\boldsymbol{w} = \boldsymbol{D}_{new}^{+}\boldsymbol{A}$ 得到的，这个过程需要花费一些时间，所以OMP算法比MP算法要慢一些。
残差 $\boldsymbol{f}$ 是通过原始的 $\boldsymbol{A}$ 和 $\boldsymbol{D}_\text{new}\cdot \boldsymbol{w}$ 计算得到的。
迭代次数最多是 $\boldsymbol{D}$ 的列数，或者是信号 $\boldsymbol{X}$ 的稀疏 $K$ 已知，那么就迭代 $K$ 次。

3 OMP缺陷

当 $\boldsymbol{D}$ 中存在中两个原子有相关性时，OMP算法可能会得到一个错误的重构信号。

$\boldsymbol{D1}=\left[\begin{array}{lll}0.6 & 0.8 & 1 \\ 0.8 & 0.6 & 0\end{array}\right]$ and $\boldsymbol{D2}=\left[\begin{array}{lll}0.6 & 0.61 & 1 \\ 0.8 & 0.79 & 0\end{array}\right]$

矩阵 $\boldsymbol{D2}$ 具有非常高的一致性，因为第二列与第一列非常相似。矩阵 $\boldsymbol{D1}$ 的一致性较差，因为第二列与第一列和第三列不太相似。由 $\mu$ 表示的一致性值定义为
$\mu=\max _{i, j ; i \neq j}|\langle \boldsymbol{D}(:, i) ,(\boldsymbol{D}:, j)\rangle| .$
$\mu$ 的值介于 $0$ 和 $1$ 之间。如果 $\mu$ 非常高，则OMP通常会给出错误的重建结果。