MVG读书笔记——求解结果的评价

最新推荐文章于 2020-09-16 20:00:00 发布

炽霜

最新推荐文章于 2020-09-16 20:00:00 发布

阅读量1k

点赞数 1

分类专栏：数值优化文章标签：读书笔记

本文链接：https://blog.csdn.net/frozenspring/article/details/78536648

版权

数值优化专栏收录该内容

8 篇文章

订阅专栏

在求出模型之后，我们往往需要对模型的正确性进行评估。这种正确性取决于许多因素，包括使用的点的数量和精度，匹配准确度，数据点之间的关系等（比如同一条直线附近的几个对应点对求出的单应矩阵可能在垂直于直线的方向就不太准确）。
对模型可靠性的度量常通过计算模型的协方差矩阵来进行。它的定义在此。对单应矩阵来说，它的协方差矩阵是一个 $9\times 9$ 的方阵。

记号规定

$X$ ——对变量X的观测
$\bar X$ ——X的实际值
$\hat X$ ——对X的估计

协方差矩阵的前向传播

我们将测量得到的变量视为一个随机变量，它是由真实值和噪声两部分构成的。我们假设噪声是高斯噪声，则通过均值和协方差矩阵可以确定随机变量的分布，同时可以很容易的得到对原始变量进行变换后的观测量的协方差矩阵。

仿射变换下模型

令v是 $IR^M$ 下的一个随机变量，它的均值为 $\bar v$ ,协方差矩阵为 $\Sigma$ ,假设 $f:IR^M\rightarrow IR^N$ 是一个仿射映射，即 $f(v)=f(\bar v)+A(v-\bar v)$ 。则 $f (v)$ 的均值为 $f(\bar v)$ 协方差矩阵为 $A\Sigma A^T$

非线性情况下的模型

如果f是一个非线性变换，我们同样可以假设它在平均值附近是一个仿射变换。即在均值附近有 $f(v)=f(\bar v)+J(v-\bar v)$ 其中J为f的Jacobian矩阵。类似上面的结果，我们通过一阶近似得到f()是一个均值为 $f(\bar v)$ ，协方差为 $J\Sigma J^T$ 。当然近似的准确程度取决于f自身的性质。

协方差的反向传播

考虑一个从参数空间 $IR^M$ 到测量空间 $IR^N$ 的可微映射f。f的函数图像为M维流形 $S_M$ 。通过寻找 $S_M$ 中最靠近测量空间上对应点的点我们得到了一个映射 $\eta:IR^N\rightarrow S_M$ 。假设上面提到的f是可逆的，我们可以定义 $f^{-1}：S_M\rightarrow IR^M$ 。

将两者结合起来，我们得到 $f^{-1}o~\eta:IR^N\rightarrow IR^M$ 。显然 $\hat P = f^{-1}o~\eta(X)$ 。由此我们将测量空间的任一点通过极大似然估计映射到了参数空间。进一步的，我们可以将测量量的概率分布传播到最大似然估计对应的参数。

仿射变换下的模型

f是仿射映射，于是 $f(P)=f(\bar P)+J(P-\bar P)$ ,其中 $f(\bar P)$ 是测量空间中变量概率分布的均值。给定一个测量矢量X。ML估计 $\hat X$ 最小化 $||X-\hat X||_\Sigma=||X-f(\hat P)||_\Sigma$ ，于是有

$||X-f(\bar P)||_\Sigma = ||(X-\bar X)-J(\hat P - \bar P)||_\Sigma$

这是一个最小二乘问题，可以解出当 $(\hat P-\bar P)=(J^T\sum^{-1}J)^{-1}J^T\Sigma^{-1}(X-\bar X)$ 时得到最小值。

记 $\bar P =f^{-1}\bar X$ , $\hat P = f^{-1}\hat X$ 。则
$f^{-1}o~\eta(X) = \hat P =(J^T\Sigma^{-1}J)^{-1}J^T\Sigma^{-1}(X-\bar X)+f^{-1}(\bar X)\\ =(J^T\Sigma^{-1}J)^{-1}J^T\Sigma^{-1}(X-\bar X)+f^{-1}o~\eta(\bar X)$

可以看出f是仿射映射的时候 $f^{-1}o~\eta$ 也是仿射映射。其中的 $(J^T\Sigma^{-1}J)^{-1}J^T\Sigma^{-1}$ 是它的线性部分，使用上面的结论，我们可以得到 $\hat P$ 的协方差矩阵是
$\Sigma_P = [(J^T\Sigma^{-1}J)^{-1}J^T\Sigma^{-1}]\Sigma[(J^T\Sigma^{-1}J)^{-1}J^T\Sigma^{-1}]^T=(J^T\Sigma^{-1}J)^{-1}$

非线性模型

类似的我们同样可以得到非线性情况下协方差的反向传播。令 $f:IR^M\rightarrow IR^N$ 是一个可微映射，J是它在点 $\bar P$ 处的雅可比矩阵。在一阶精度下， $\hat P = f^{-1} o~\eta(X)$ 是一个均值为 $\bar P$ 协方差为 $(J^T\Sigma^{-1}_xJ)^{-1}$ 的随机变量。

超参数化的情况

超参数化的情况下参数空间 $IR^M$ 到测量空间 $IR^N$ 不是一一对应的。一组测量值可能同时符合多组参数。比如对单应矩阵H来说，我们可以对它乘一个系数k，得到的单应矩阵与原矩阵是等价的。

为了求解唯一的参数，我们在求解的过程中往往会加一些额外的约束，比如令 $∣ ∣ H ∣ ∣ = 1$ 或者 $H_9=1$ 。于是H被限定在了参数空间 $IR^9$ 的一个曲面上。更一般的，我们可以假设估计的参数P被限定在 $IR^M$ 的某个子流形上。

超参数的情况下 $f:IR^M \rightarrow IR^N$ 的Jacobian矩阵不是满秩的。具体来说，此时 $r (J) < M$ ，令 $d = r (J)$ ，称d为本质参数数。显然此时 $(J^T\Sigma^{-1}J)$ 不可逆， $\Sigma_p$ 不能用上面的公式进行计算。

令 $f:IR^M\rightarrow IR^N$ 是一个可微映射，把一组参数 $\bar P$ 映射到测量矢量 $\bar X$ 。

令 $S_p$ 是嵌入 $IR^M$ 中的过点 $\bar P$ 的d维光滑流形，并使得映射f在流形 $S_p$ 上 $\bar P$ 的一个邻域内是一一对应的，f把 $S_p$ 局域的映射到 $IR^N$ 上到流形 $f(X_p)$ 。函数f有一个局部逆函数，记为 $f^{-1}$ 。它在曲面 $f(S_p)$ 上到 $\bar X$ 的一个邻域内有意义。