基础矩阵F和本质矩阵E

最新推荐文章于 2025-08-25 14:15:01 发布

原创最新推荐文章于 2025-08-25 14:15:01 发布 · 1.3k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#slam #计算机视觉

slam 专栏收录该内容

6 篇文章

订阅专栏

基础矩阵（Fundamental Matrix）F 和本质矩阵（Essential Matrix）E
重新仔细看了高博的十四讲对极几何部分，整理一下思路。
首先是外积的定义，三维向量a和向量b做外积，a^b可以转换为3*3的矩阵与b做内积.
$\boldsymbol{a} \times \boldsymbol{b}=\left[\begin{array}{ccc} \boldsymbol{i} & \boldsymbol{j} & \boldsymbol{k} \\ a_{1} & a_{2} & a_{3} \\ b_{1} & b_{2} & b_{3} \end{array}\right]=\left[\begin{array}{c} a_{2} b_{3}-a_{3} b_{2} \\ a_{3} b_{1}-a_{1} b_{3} \\ a_{1} b_{2}-a_{2} b_{1} \end{array}\right]=\left[\begin{array}{ccc} 0 & -a_{3} & a_{2} \\ a_{3} & 0 & -a_{1} \\ -a_{2} & a_{1} & 0 \end{array}\right] \boldsymbol{b} \triangleq \boldsymbol{a}^{\wedge} \boldsymbol{b}$
对世界坐标为P的空间点，其在两成像平面坐标为p1，p2，有
$s_{1} \boldsymbol{p}_{1}=\boldsymbol{K} \boldsymbol{P}, \quad s_{2} \boldsymbol{p}_{2}=\boldsymbol{K}(\boldsymbol{R} \boldsymbol{P}+\boldsymbol{t})$
齐次坐标下为
$\boldsymbol{p}_{1}=\boldsymbol{K} \boldsymbol{P}, \quad \boldsymbol{p}_{2}=\boldsymbol{K}(\boldsymbol{R} \boldsymbol{P}+\boldsymbol{t})$
取
$\boldsymbol{x}_{1}=\boldsymbol{K}^{-1} \boldsymbol{p}_{1}, \quad \boldsymbol{x}_{2}=\boldsymbol{K}^{-1} \boldsymbol{p}_{2}$
于是有
$\boldsymbol{x}_{2}=\boldsymbol{R} \boldsymbol{x}_{1}+\boldsymbol{t}$
接下来是整合式子的部分，为了将式子整合成一边为0的乘积形式，首先利用外积，两边同时左乘t^
$\boldsymbol{t}^{\wedge} \boldsymbol{x}_{2}=\boldsymbol{t}^{\wedge} \boldsymbol{R} \boldsymbol{x}_{1}$
再左乘x2的转置
$\boldsymbol{x}_{2}^{T} \boldsymbol{t}^{\wedge} \boldsymbol{x}_{2}=\boldsymbol{x}_{2}^{T} \boldsymbol{t}^{\wedge} \boldsymbol{R} \boldsymbol{x}_{1}$
t与x2的外积垂直于t和x2，因此其与x2做内积等于0，即等式两边等于0.
$\boldsymbol{x}_{2}^{T} \boldsymbol{t}^{\wedge} \boldsymbol{R} \boldsymbol{x}_{1}=0$
代入原式，便得到了对极约束，其几何意义为两相机的中心和点P共面，且包含了相机内参和相机位姿的信息。
$\boldsymbol{p}_{2}^{T} \boldsymbol{K}^{-T} \boldsymbol{t}^{\wedge} \boldsymbol{R} \boldsymbol{K}^{-1} \boldsymbol{p}_{1}=0$
便有了本质矩阵E和基础矩阵F的定义：
$\boldsymbol{E}=\boldsymbol{t}^{\wedge} \boldsymbol{R}$
$\boldsymbol{F}=\boldsymbol{K}^{-T} \boldsymbol{E} \boldsymbol{K}^{-1}$

因此，有
$\boldsymbol{x}_{2}^{T} \boldsymbol{E} \boldsymbol{x}_{1}=\boldsymbol{p}_{2}^{T} \boldsymbol{F} \boldsymbol{p}_{1}=0$
位姿t与R的内积就可以转换成t转变的33的矩阵与R相乘，结果是一个33的矩阵，也就是本质矩阵E。

至此，相机位姿估计问题可以转变为：
1.根据配对点的像素位置，求出 E 或者 F；
2.根据 E 或者 F，求出 R, t。

在求解本质矩阵E的时候，由于其等式等于0，乘以任意常数仍应等于0，因此本质矩阵E具有尺度不变性，原本3*3应有9个自由度，由于尺度不变性使得8对点即可解出E（若考虑R和t的各三个自由度，只需3+3-1=5对点，但因为非线性的性质，会有一定的麻烦）。

一个3×3的矩阵是本质矩阵的充要条件是它的奇异值中有两个相等而第三个是0。
由于t^是反对称矩阵，根据反对称矩阵的性质，有
${t}^{\wedge}=k U Z U^{T}$
其中， $Z=\left[\begin{array}{ccc} 0 & 1 & 0 \\ -1 & 0 & 0 \\ 0 & 0 & 0 \end{array}\right]$
令 $W=\left[\begin{array}{ccc} 0 & -1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{array}\right]$
于是有
$Z=\operatorname{diag}(1,1,0) W$
E的奇异值分解为 $\boldsymbol{E}=\boldsymbol{U} \boldsymbol{\Sigma} \boldsymbol{V}^{T}$
因为本质矩阵E的奇异值特性，因此Z与∑ W只相差了一个常数的尺度。