多视图几何(4)_算法评价和误差分析-CSDN博客

本文链接：https://blog.csdn.net/qq_42823933/article/details/134343103

文章探讨了算法的性能评价方法，包括单图像和双图像误差的计算，以及最优估计如MLE的理论基础。重点阐述了估计问题中协方差和误差的计算，以及如何通过MLE模型分析算法的收敛性。同时讨论了超参数化情况下协方差的反向传播及其应用。

摘要由CSDN通过智能技术生成

算法评价和误差分析

性能的上下界

单图像误差

$\varepsilon_{res} = (\frac1{2n} \sum_{i=1}^n d(x_i^\prime,\hat{x}_i^\prime)^2)^{1/2}$

双图像误差

$\varepsilon_{res} = \frac1{\sqrt{4n}}(\sum_{i=1}^n d(x_i,\hat{x}_i)^2 +\sum_{i=1}^n d(x_i,\hat{x}_i^\prime)^2 )^{1/2}$

最优估计算法MLE

几何误差的最小化等于MLE，因此任何实现几何误差最小化的算法的目标应该是达到MLE给出的理论界。最小化不同代价函数的其它算法可以根据它与MLE所给出的界的接近程度做性能判断。

一般的估计问题关系到一个由 $IR^M$ 到 $IR^N$ 的函数 $f$ ，其中 $IR^M$ 是参数空间， $IR^N$ 是测量空间。现在考虑一个点 $\overline X\in IR^N$ ，且存在一个参数向量 $\overline P \in IR^M$ 使得 $f(\overline P) = \overline X$ 。

令 $X$ 是根据各向同性高斯分布选取的测量向量，其均值为测量真值 $\overline X$ 而方差为 $N\sigma^2$ （表示 $N$ 个分量都有方差 $\sigma^2$ ）。当参数向量 $P$ 的值在 $\overline P$ 的领域变换时，函数 $f (P)$ 的值形成 $IR^N$ 中过点 $\overline X$ 的曲面 $S_M$ 。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

给定测量向量 $X$ ，最大似然估计 $\hat X$ 是 $S_M$ 上的最接近 $X$ 的点。ML估计算法就是返回该曲面上离 $X$ 最近的点的算法。假定在 $\overline X$ 的领域曲面基本上是平面，即切平面可作为他的一个很好的近似，估计 $\hat X$ 是到 $X$ 切平面上的垂足。残差是点 $X$ 到估计值 $\hat X$ 的距离， $\hat X$ 到 $\overline X$ 的距离是最佳估计值到真值的距离。

$IR^N$ 上总方差为 $N\sigma^2$ 的各向同性高斯分布向一个 $s$ 维子空间的投影是总方差为 $s\sigma^2$ 的各向同性高斯分布
考虑一个估计问题，其中 $N$ 个测量由依赖于 $d$ 个本质参数集的函数模型化。假定每个测量变量有标准差 $\sigma^2$ 的独立高斯噪声
- $M L$ 估计算法的 $RMS$ 残差（测量值到估计值的距离）是
  $\varepsilon_{res} = E[\parallel \hat X -X \parallel^2/N]^{1/2} = \sigma(1-d/N)^{1/2}$
- ML估计算法的 $RMS$ 估计误差（估计值到真值的距离）是
  $\varepsilon_{est} = E[\parallel \hat X - X \parallel ^2/N]^{1/2} = \sigma(d/N)^{1/2}$

确定一个算法的正确收敛性

根据MLE的模型，有
$\parallel X - \overline X \parallel ^2 = \parallel X - \hat X \parallel ^2 + \parallel \overline X - \hat X \parallel ^2$
在评估采用合成数据的一个算法时，此等式给出一个简单的测试，查看该算法是否已收敛到最优值。如果 $\hat X$ 停滞到局部最优解，等式右边大于左边。

估计变换的协方差

比起残差或估计误差，变换本身的准确度如何更值得关心，这是由协方差表示的

协方差的前向传播

仿射
令 $v$ 是 $IR^M$ 中的一个具有均值 $\overline v$ 和协方差矩阵 $\Sigma$ 的随机向量，假定 $f:IR^M \rightarrow IR^N$ 是一个仿射映射：定义为 $f(\overline v) + A(v- \overline v)$ 。那么 $f (v)$ 是一个具有均值 $f(\overline v)$ 和协方差矩阵 $A\Sigma A^T$ 的随机变量。
非线性
令 $v$ 是 $IR^M$ 中一个具有均值 $\overline v$ 和协方差矩阵 $\Sigma$ 的随机向量，令 $f:IR^M \rightarrow IR^N$ 在 $\overline v$ 的领域可微。那么在精确到一阶近似的程度下， $f (v)$ 是一个具有均值 $f(\overline v)$ 和协方差矩阵 $J\Sigma J^T$ 的随机变量，其中 $J$ 是 $f$ 的雅克比矩阵在 $\overline v$ 的值

协方差的反向传播

仿射情形
令 $f:IR^M \rightarrow IR^N$ 是形为 $f(\overline P)+ J(P-\overline P)$ 的仿射映射，其中 $J$ 的秩等于 $M$ 。令 $X$ 是 $IR^N$ 中一个具有均值 $\overline X = f(\overline P)$ 和协方差矩阵 $\Sigma$ 的随机变量。令 $f^{-1} \circ \eta: IR^N \rightarrow IR^M$ 是一个映射，它把测量向量 $X$ 映射到对应于 $M L$ 估计 $\hat X$ 的参数集合。那么 $\hat P = f^{-1} \circ \eta(X)$ 是一个具有均值 $\overline P$ 和协方差矩阵 $(J^T \Sigma_X^{-1} J)^{-1}$ 的随机变量
非线性情形
令 $f:IR^M \rightarrow IR^N$ 是一个可微映射，而 $J$ 是它在点 $\overline P$ 处的雅克比矩阵。假定 $J$ 的秩为 $M$ 。则 $f$ 在 $\overline P$ 的领域是一一对应的。令 $X$ 是 $IR^N$ 中一个具有均值 $\overline X = f(\overline P)$ 和协方差矩阵 $\Sigma_X$ 的随机变量。令映射 $f^{-1} \circ \eta: IR^N \rightarrow IR^M$ 是一个映射，把测量向量 $X$ 映射到对应于 $M L$ 估计 $\hat X$ 的参数集合。那么在一阶精度下， $\hat P = f^{-1} \circ \eta(X)$ 是一个具有均值 $\overline P$ 和协方差矩阵 $(J^T\Sigma_XJ)^{-1}$ 的随机变量

超参数化

把协方差反向传播推广到冗余数据集超参数化的情形

令 $f:IR^M \rightarrow IR^N$ 是一个可微映射，它将一组参数 $\overline P$ 映射到测量向量 $X$ 。令 $S_P$ 是嵌入 $IR^M$ 中的过点 $\overline P$ 的 $d$ 维光滑流形并使得映射 $f$ 在流形 $S_P$ 上 $\overline P$ 的一个领域内是一一对应的， $f$ 把 $\overline P$ 局域地映射到 $IR^N$ 上的流形 $f(S_P)$ 。函数 $f$ 有一个局部逆函数，记为 $f^{-1}$ ，它限制在曲面 $f(S_P)$ 上的一个领域内。定义 $IR^N$ 上的一个具有均值 $\overline X$ 和协方差 $\Sigma_X$ 的高斯分布，并令 $\eta:IR^N \rightarrow f(S_P)$ 把 $IR^N$ 上的点映射到 $f(S_P)$ 上并在 $M aha l an o bi s$ 范数 $\parallel \cdot \parallel _{\Sigma_X}$ 意义下最近的点。 $IR^N$ 上具有协方差矩阵 $\Sigma_X$ 的概率分布通过 $f^{-1} \circ \eta$ 诱导 $IR^M$ 上的概率分布，它在一阶精度下的协方差矩阵是
$\Sigma_P = (J^T\Sigma_X ^{-1} J)^{+A} = A(A^TJ^T\Sigma^{-1}_X JA)^{-1} A^T$
其中， $A$ 的列向量生成 $S_P$ 的过点 $\overline P$ 的且空间

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

令可微映射 $f:IR^M \rightarrow IR^N$ 把 $\overline P$ 映射到 $\overline X$ ，并令 $J$ 为 $f$ 的雅克比矩阵。设 $IR^N$ 上一个具有协方差矩阵 $\Sigma_X$ 的高斯分布定义在 $\overline X$ ，令 $f^{-1} \circ \eta :IR^M \rightarrow IR^N$ 是把一个测量 $X$ 映射到约束在局部正交于 $J$ 的零空间的曲面 $S_P$ 上的MLE参数向量 $P$ 的映射，那么 $f^{-1} \circ \eta$ 诱导在 $IR^M$ 上的一个分布，他的协方差矩阵在一阶精度下等于
$\Sigma_P = (J^T \Sigma_X^{-1} J )^+$