[三维重建] 对极几何约束、本质矩阵、基础矩阵、单应矩阵

Zeehoy

已于 2022-09-11 16:27:31 修改

阅读量2.2k

点赞数 5

分类专栏：三维重建文章标签：线性代数几何学计算机视觉

于 2022-05-16 22:21:21 首次发布

本文链接：https://blog.csdn.net/weixin_44179561/article/details/124807350

版权

三维重建专栏收录该内容

5 篇文章

订阅专栏

本文详细介绍了对极几何中的核心概念，包括本质矩阵、基础矩阵和单应矩阵。本质矩阵E由相机运动和平移t决定，通过x2^TEx1=0约束了归一化坐标间的对应关系；基础矩阵F与本质矩阵E仅差相机内参，通过p2^TFp1=0约束像素坐标对应；单应矩阵H描述了同一平面上点在不同图像间的映射。八点法和五点法分别用于求解本质矩阵，前者使用8对匹配点，后者仅需5对。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、对极几何约束

假设相机从 $O_1$ 经过旋转平移运动， $R ， t$ ，到达新的位置 $O_2$ 。 $I_1，I_2$ 分别为相机在两个位置的成像平面，空间中同一点 $P$ ，在两个成像平面上的投影分别为 $p_1，p_2$ 。

极平面： $O_1，P，O_2$ 三点确定的平面（ $\Delta O_1PO_2$ 所在的平面）
极点： $O_1，O_2$ 连线与两个成像平面 $I_1，I_2$ 的交点 $e_1，e_2$
基线：两个相机光心的连线 $O_1O_2$
极线：极平面与两个成像平面之间的相交线 $l_1，l_2$

1、本质矩阵

假设在第一帧所在坐标系下，点P的坐标为：
$P=\begin{bmatrix} X\\ Y\\ Z\\ \end{bmatrix}$
根据针孔相机模型的投影公式，两个成像平面上像素点 $p_1，p_2$ 的坐标位置为：
$s_1p_1=KP\tag{1}$
$s_2p_2=K(RP+t)\tag{2}$
这里， $K$ 为 $3 \times 3$ 的相机内参数矩阵； $R ， t$ 为相机的运动，具体来说，这里应该是 $R_{21}，t_{21}$ ，将 $O_1$ 坐标系下的坐标 $P$ 转换到了 $O_2$ 坐标系下的坐标 $R_{21}P+t_{21})$ ； $s_1$ 为深度信息，即空间点 $P$ 到相机光心 $O_1$ 的距离， $s_2$ 则为空间点 $P$ 到相机光心 $O_2$ 的距离，两者并不相等； $p_1，p_2$ 为 $3\times 1$ 的齐次坐标形式， $P$ 为 $3\times 1$ 的欧氏坐标形式。

根据针孔相机模型的投影公式：
$Z\begin{bmatrix}u\\v\\1\end{bmatrix}=K\begin{bmatrix}X\\Y\\Z\end{bmatrix}$
令等式两边同时乘 $\frac{1}{Z}$ ：
$\begin{bmatrix}u\\v\\1\end{bmatrix}=K\begin{bmatrix}\frac{X}{Z}\\\\\frac{Y}{Z}\\\\1\end{bmatrix}$
令等式两边同时左乘 $K^{-1}$ ：
$K^{-1}\begin{bmatrix}u\\v\\1\end{bmatrix}=\begin{bmatrix}\frac{X}{Z}\\\\\frac{Y}{Z}\\\\1\end{bmatrix}$
可以看出，对像素点二维坐标的齐次坐标左乘 $K^{-1}$ 后，并不能恢复到空间点的三维坐标 $\begin{bmatrix} X\\ Y\\ Z\\ \end{bmatrix}$ ，而是得到这个三维坐标在归一化平面（ $Z = 1 的平面$ ）上的坐标： $\begin{bmatrix}\frac{X}{Z}\\\\\frac{Y}{Z}\\\\1\end{bmatrix}$

现在，取：
$x_1=K^{-1}p_1\tag{3}$
$x_2=K^{-1}p_2\tag{4}$

可知， $x_1，x_2$ 是两个像素点的归一化平面上的坐标。

联立式（1）（2）（3）（4）：

由 $s_2p_2=K(RP+t)$ 等式两边左乘 $K^{-1}$ ：
$K^{-1}s_2p_2=RP+t$
$s_2K^{-1}p_2=RP+t$
$s_2x_2=RP+t\tag{5}$
由 $s_1p_1=KP$ 等式两边左乘 $K^{-1}$ ：
$K^{-1}s_1p_1=P$
$s_1K^{-1}p_1=P$
$s_1x_1=P$
将 $s_1x_1=P$ 代入式（5），得：
$s_2x_2=Rs_1x_1+t$
在等式两侧同时左乘 $t^{\wedge}$ ：
$s_2t^{\wedge}x_2=s_1t^{\wedge}Rx_1+t^{\wedge}t\\ =s_1t^{\wedge}Rx_1\\ (后面那块t\times t的结果是零向量，所以没有了)$
$^{\wedge}$ 的定义：在《视觉SLAM十四讲》中， $a^{\wedge}$ 是与向量 $a$ 一一对应的一个反对称矩阵， $a^{\wedge}b=a\times b$ ，实际上就是一个叉乘的矩阵表达形式，在某些地方 $a^{\wedge}$ 也可能写成 $a_{×}$ ，知道是同一个意思就好

上式中，再同时左乘 $x_2^T$ ：
$s_2x_2^Tt^{\wedge}x_2=s_1x_2^Tt^{\wedge}Rx_1$
观察上述等式的左侧， $t^{\wedge}x_2$ 的结果是一个与 $t，x_2$ 均垂直的向量，左乘 $x_2^T$ 相当于 $x_2$ 点乘向量 $t^{\wedge}x_2$ 。由于向量 $t^{\wedge}x_2$ 必定与 $x_2$ 垂直，因此 $x_2$ 点乘向量 $t^{\wedge}x_2$ 的结果自然是0。
$\frac{s_2}{s_1}x_2^Tt^{\wedge}x_2=x_2^Tt^{\wedge}Rx_1$
由于 $x_2^Tt^{\wedge}x_2=0$ ， $s_1，s_2$ 是常数，最终得到结果：
$x_2^Tt^{\wedge}Rx_1=0\tag{6}$
将式（6）的中间部分 $t^{\wedge}R$ 记作 $E$ ，即本质矩阵：
$x_2^TEx_1=0$

从式子中可以看到，本质矩阵约束了空间中同一个三维点，在两个归一化平面坐标之间的联系

2、基础矩阵

再将归一化坐标与像素点坐标的关系 $x_1=K^{-1}p_1$ ， $x_2=K^{-1}p_2$ 代入式（6），得：
$(K^{-1}p_2)^Tt^{\wedge}RK^{-1}p_1=0$
$p_2^TK^{-T}t^{\wedge}RK^{-1}p_1=0\tag{7}$
将式（7）的中间部分 $K^{-T}t^{\wedge}RK^{-1}$ 记作 $F$ ，即基础矩阵：
$p_2^TFp_1=0$
从式子中可以看到，基础矩阵约束了空间中同一个三维点，在两个成像平面上，像素坐标之间的联系，记住这里的 $p_1，p_2$ 是 $3\times 1$ 的齐次坐标形式。

可以看出，基础矩阵 $F$ 与本质矩阵 $E$ 之间只相差相机内参数矩阵 $K$ ：
$F=K^{-T}EK^{-1}$

3、单应矩阵

（1）前置知识：

平面的表示形式：
$n^TP+d=0$
其中，n是平面的单位法向量，P是平面上一点，d是该平面距离坐标原点的有向距离，如果平面面向原点，则d为正，如果平面背向原点，则d为负。

推导：来自于平面的一般式
$A x + B y + C z + D = 0$
一般式中，（A,B,C）为平面的法向量，（x,y,z）为平面上任意一点。而D实际是平面距原点的有向距离。

（0,0,0）到平面的距离:
$d=\frac{|A×0+B×0+C×0+D|}{\sqrt{A^2+B^2+C^2}}=\frac{|D|}{1}=|D|$
在这里，d是无向距离，D是有向距离，有正负的。

所以，由一般式：
$A x + B y + C z + 有向距离 = 0$
$n^TP+有向距离=0$

(2)单应矩阵：

单应矩阵用于描述处于共同平面上的一些点（三维空间中）在两张图像（二维图像）之间的对应关系。
在这里插入图片描述
如上图所示，空间中存在一平面Π，平面的单位法向量为n，平面上一点P在两台摄像机所拍摄到的图像上的投影为 $p_1，p_2$

设平面Π满足方程：
$n^TP+d=0$
$-\frac{n^TP}{d}=1$
由于P在图像 $I_2$ 上的投影为 $p_2$ ：
$s_2p_2=K(RP+t)$
$=K(RP+t·(-\frac{n^TP}{d}))$
将P提公因式：
$=K(R-\frac{tn^T}{d})P$
由于：
$s_1p_1=KP$
$s_1K^{-1}p_1=P$
有：
$s_2p_2=K(R-\frac{tn^T}{d})s_1K^{-1}p_1$
$\frac{s_2}{s_1}p_2=K(R-\frac{tn^T}{d})K^{-1}p_1$

$s_1，s_2$ 为尺度，在尺度等价下，有：

$p_2\cong K(R-\frac{tn^T}{d})K^{-1}p_1$

令
$K(R-\frac{tn^T}{d})K^{-1}=H$
即单应矩阵

$p_2\cong Hp_1$

观察 $H$ 的形式能发现，单应矩阵的定义中包含了摄像机的旋转、平移以及平面的相关参数。

4、总结

本质矩阵

$x_2^TEx_1=0$
$E=t^{\wedge}R$
本质矩阵约束了空间中同一个三维点，在两个归一化平面坐标之间的联系。（归一化平面即Z=1的平面）

基础矩阵

$p_2^TFp_1=0$
$F=K^{-T}t^{\wedge}RK^{-1}$
$F=K^{-T}EK^{-1}$
基础矩阵约束了空间中同一个三维点，在两个成像平面上的像素坐标之间的联系。

且基础矩阵 $F$ 与本质矩阵 $E$ 之间只相差相机内参数矩阵 $K$ 。

单应矩阵

$p_2\cong Hp_1$
$H=K(R-\frac{tn^T}{d})K^{-1}$
单应矩阵约束了空间中处于某一已知平面上的同一个三维点，在两个成像平面上的像素坐标之间的联系

二、本质矩阵求解

本质矩阵的自由度： $E=t^{\wedge}R$ ，是一个 $3\times 3$ 的矩阵，内有9个未知数，因此存在9个自由度。

1.八点法

由于对极约束 $x_2^TEx_1=0$ 是等式为零的约束，意思是中间的本质矩阵 $E$ 即使经过任意常数 $k$ 倍的缩放，等式仍然成立： $x_2^TkEx_1=0$
意味着本质矩阵 $E$ 与它的 $k$ 倍缩放 $k E$ 是等价效果的，即 $E$ 在不同尺度下是等价的：
$E\simeq kE$
由于这种性质，可以将 $E$ 中所有元素均除以矩阵内任意一个非零元素，如 $e_1$ ：
$E=\begin{bmatrix} e_1&e_2&e_3\\ e_4&e_5&e_6\\ e_7&e_8&e_9 \end{bmatrix}\simeq\begin{bmatrix} \frac{e_1}{e_1}&\frac{e_2}{e_1}&\frac{e_3}{e_1}\\ \frac{e_4}{e_1}&\frac{e_5}{e_1}&\frac{e_6}{e_1}\\ \frac{e_7}{e_1}&\frac{e_8}{e_1}&\frac{e_9}{e_1} \end{bmatrix}\simeq\begin{bmatrix} 1&\frac{e_2}{e_1}&\frac{e_3}{e_1}\\ \frac{e_4}{e_1}&\frac{e_5}{e_1}&\frac{e_6}{e_1}\\ \frac{e_7}{e_1}&\frac{e_8}{e_1}&\frac{e_9}{e_1} \end{bmatrix}$
使其中某个元素处的值为1，从而减少一个自由度

在这种情况下，9个自由度的本质矩阵 $E$ 可变成8个自由度

考虑一对匹配点，它们的归一化坐标为 $x_1=\begin{bmatrix}U_1\\V_1\\1\end{bmatrix}$ ， $x_2=\begin{bmatrix}U_2\\V_2\\1\end{bmatrix}$ ，根据本质矩阵约束有：
$x_2^TEx_1=\begin{bmatrix} U_2&V_2&1 \end{bmatrix} \begin{bmatrix} e_1&e_2&e_3\\ e_4&e_5&e_6\\ e_7&e_8&e_9 \end{bmatrix} \begin{bmatrix} U_1\\V_1\\1 \end{bmatrix}=0$
$\begin{bmatrix} U_2U_1&U_2V_1&U_2&V_2U_1&V_2V_1&V_2&U_1&V_1&1 \end{bmatrix}\begin{bmatrix} e_1\\e_2\\e_3\\e_4\\e_5\\e_6\\e_7\\e_8\\e_9 \end{bmatrix}=0$
可见，一对匹配点能得到一条方程，求解一个未知数，针对本质矩阵 $E$ 的八个自由度，需要求解八个未知数，即需要八对匹配点，组成一个齐次线性方程组：
$\begin{bmatrix} U_2^1U_1^1&U_2^1V_1^1&U_2^1&V_2^1U_1^1&V_2^1V_1^1&V_2^1&U_1^1&V_1^1&1\\ U_2^2U_1^2&U_2^2V_1^2&U_2^2&V_2^2U_1^2&V_2^2V_1^2&V_2^2&U_1^2&V_1^2&1\\ \vdots&\vdots&\vdots&\vdots&\vdots&\vdots&\vdots&\vdots&\vdots\\ U_2^8U_1^8&U_2^8V_1^8&U_2^8&V_2^8U_1^8&V_2^8V_1^8&V_2^8&U_1^8&V_1^8&1 \end{bmatrix}_{8\times 9}\begin{bmatrix} e_1\\e_2\\e_3\\e_4\\e_5\\e_6\\e_7\\e_8\\e_9 \end{bmatrix}=0$
解上述齐次线性方程组，即可得到本质矩阵 $E$ 。

2.五点法

本质矩阵 $E=t^{\wedge}R$ ，根据本质矩阵的定义，平移有3个自由度，旋转有3个自由度，因此本质矩阵可以缩小到6个自由度，再根据八点法中提到的尺度等价约束，可以再缩小一个自由度，最终本质矩阵实际上可以是5个自由度，即由5对匹配点就可以进行求解。

但由于这种做法形式复杂，而从工程实际角度考虑，实际上两幅图片大概率会有非常多对匹配点，甚至多达上百对，从八点法降低到五点法的意义并不明显。

参考：
1.对极几何 Epipolar Geometry
https://zhuanlan.zhihu.com/p/79845576
2.《视觉SLAM十四讲》——高翔、张涛
3.视觉SLAM中，本质矩阵、基础矩阵、单应性矩阵自由度和秩分析。
https://blog.csdn.net/Walking_roll/article/details/119343924
4.SLAM基础知识补充：多视图几何
https://note.youdao.com/ynoteshare1/index.html?id=5e98f487c40ef22f90e1177f29271be5&type=note