SLAM十四讲之第七讲：2D-2D对极几何与3D-2DPnP问题推导

原创

已于 2023-11-09 10:02:11 修改 · 304 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#数码相机 #c++ #计算机视觉

于 2023-10-28 17:23:39 首次发布

本文围绕视觉里程计展开，介绍2D - 2D对极几何，包括对极约束、本质矩阵性质及求解方法、单应矩阵使用场景与推导等；还阐述3D - 2D PnP，如直接线性变化DLT、P3P及最小化重投影误差求解PnP的数学模型、导数推导等内容。

第七讲：视觉里程计2

2 2D-2D对极几何

作者应该是基于ORB-SLAM写的后续内容。

2.1 对极约束

在这里插入图片描述

在第一帧坐标系下，三维点P的坐标如下：

$\boldsymbol{P}=[X, Y, Z]^{\mathrm{T}}$

K是相机内参矩阵，把相机系得点转换为像素坐标系点。这里我们以第一帧坐标系为参考坐标系(世界系)，把第1帧投影到第2帧当中。

$s_1 \boldsymbol{p}_1=\boldsymbol{K} \boldsymbol{P}, \quad s_2 \boldsymbol{p}_2=\boldsymbol{K}(\boldsymbol{R}_{21} \boldsymbol{P}+\boldsymbol{t}_{21})$

在相机模型中，s一般都是指三维点P得深度Z，也就是一个常数， $s p 和 p$ 形成了投影关系，它们在尺度意义下是相等的！
$sp\simeq p$

把投影方程改为尺度意义下等式：
$p_1\simeq KP,\quad p_2\simeq K\left(RP+t\right)$
p是像素点坐标，乘以 $K^{-1}$ 后即为相机坐标系下得归一化坐标 $x$ ，
$\begin{aligned} &\boldsymbol{x}_1=\boldsymbol{K}^{-1} \boldsymbol{p}_1, \quad \boldsymbol{x}_2=\boldsymbol{K}^{-1} \boldsymbol{p}_2 . \end{aligned}$

把第1帧下得归一化坐标投影到第二帧下，得到尺度意义下等式（或利用上面得式子带入到尺度意义下投影方程）

$\boldsymbol{x}_2 \simeq \boldsymbol{R} \boldsymbol{x}_1+\boldsymbol{t}$

注意向量t反对称矩阵也即向量与向量得叉积，对上述式子左乘向量t，可得：

$\begin{aligned} &\boldsymbol{t}^{\wedge} \boldsymbol{x}_2 \simeq \boldsymbol{t}^{\wedge} \boldsymbol{R} \boldsymbol{x}_1 \end{aligned}$

向量 ${t}^{\wedge}x$ 即叉积，得到得结果是一个垂直于t和x得向量，所以在乘以x，那么向量得点击必然为0.
$\boldsymbol{x}_2^{\mathrm{T}} \boldsymbol{t}^{\wedge} \boldsymbol{x}_2 \simeq \boldsymbol{x}_2^{\mathrm{T}} \boldsymbol{t}^{\wedge} \boldsymbol{R} \boldsymbol{x}_1 =0$
此时，得到得下面这两个式子就是对极约束，分别由本质矩阵E和基础矩阵F组成
$\begin{aligned} &\boldsymbol{x}_2^{\mathrm{T}} \boldsymbol{t}^{\wedge} \boldsymbol{R} \boldsymbol{x}_1=0\\ &\boldsymbol{p}_2^{\mathrm{T}} \boldsymbol{K}^{-\mathrm{T}} \boldsymbol{t}^{\wedge} \boldsymbol{R} \boldsymbol{K}^{-1} \boldsymbol{p}_1=0 \end{aligned}$

也能够推断出，本质矩阵E和基础矩阵F之间相差一个内参矩阵K
$\boldsymbol{E}=\boldsymbol{t}^{\wedge} \boldsymbol{R}, \quad \boldsymbol{F}=\boldsymbol{K}^{-\mathrm{T}} \boldsymbol{E} \boldsymbol{K}^{-1}, \quad \boldsymbol{x}_2^{\mathrm{T}} \boldsymbol{E} \boldsymbol{x}_1=\boldsymbol{p}_2^{\mathrm{T}} \boldsymbol{F} \boldsymbol{p}_1=0$

2.2 本质矩阵

2.2.1 本质矩阵性质

$\boldsymbol{E}=\boldsymbol{t}^{\wedge} \boldsymbol{R}$ 是一个3*3矩阵

对极约束得条件是 $0$ ，所以该等式乘以任意得常数后仍然为 $0$ ，也即对E乘以任意的常数后，对极约束依然成立。即 $E$ 在不同尺度下是等价的。
本质矩阵 $E$ 经过 $S V D$ 分解后的奇异值必然是 $[\sigma,\sigma,0]^\mathrm{T}$ .
本质矩阵实际只有5个自由端(旋转3+偏移3-尺度1)

2.2.2 八点法求解本质矩阵

考虑一对匹配点，它们的归一化坐标为 $\boldsymbol{x}_1=[u_1,v_1,1]^\mathrm{T},\boldsymbol{x}_2=[u_2,v_2,1]^\mathrm{T}$ 。根据对极约束，有

$\left(u_2, v_2, 1\right)\left(\begin{array}{ccc} e_1 & e_2 & e_3 \\ e_4 & e_5 & e_6 \\ e_7 & e_8 & e_9 \end{array}\right)\left(\begin{array}{c} u_1 \\ v_1 \\ 1 \end{array}\right)=0 .$

把本质矩阵E写成一个向量的形式

$\boldsymbol{e}=[e_1,e_2,e_3,e_4,e_5,e_6,e_7,e_8,e_9]^\mathrm{T}$
则对极约束可以写成于e有关的线性形式：
$[u_2u_1,u_2v_1,u_2,v_2u_1,v_2v_1,v_2,u_1,v_1,1]\cdot\boldsymbol{e}=0$
就是说，一对点可以得到一个上面的式子，我们利用八对点就可得到下面的方程。这个方程可以看成9*9的矩阵，最后一行为0，就是这个矩阵不满秩，那么它一定有非0解且唯一！
$\left(\begin{array}{ccccccccc} u_2^1 u_1^1 & u_2^1 v_1^1 & u_2^1 & v_2^1 u_1^1 & v_2^1 v_1^1 & v_2^1 & u_1^1 & v_1^1 & 1 \\ u_2^2 u_1^2 & u_2^2 v_1^2 & u_2^2 & v_2^2 u_1^2 & v_2^2 v_1^2 & v_2^2 & u_1^2 & v_1^2 & 1 \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \\ u_2^8 u_1^8 & u_2^8 v_1^8 & u_2^8 & v_2^8 u_1^8 & v_2^8 v_1^8 & v_2^8 & u_1^8 & v_1^8 & 1 \end{array}\right)\left(\begin{array}{l} e_1 \\ e_2 \\ e_3 \\ e_4 \\ e_5 \\ e_6 \\ e_7 \\ e_8 \\ e_9 \end{array}\right)=0 .$

2.2.3 怎么利用E来求解位姿

我们最关系的是利用 $E$ 来估计相机运动 $R ， t$ ，通过奇异值分解计算
$E=U\Sigma V^{\mathrm{T}}$
参考计算机视觉中的多视图几何200页结论
$\begin{aligned} \boldsymbol{t}_1^{\wedge} & =\boldsymbol{U} \boldsymbol{R}_Z\left(\frac{\pi}{2}\right) \boldsymbol{\Sigma} \boldsymbol{U}^{\mathrm{T}}, \quad \boldsymbol{R}_1=\boldsymbol{U} \boldsymbol{R}_Z^{\mathrm{T}}\left(\frac{\boldsymbol{\pi}}{2}\right) \boldsymbol{V}^{\mathrm{T}} \\ \boldsymbol{t}_2^{\wedge} & =\boldsymbol{U} \boldsymbol{R}_Z\left(-\frac{\pi}{2}\right) \boldsymbol{\Sigma} \boldsymbol{U}^{\mathrm{T}}, \quad \boldsymbol{R}_2=\boldsymbol{U} \boldsymbol{R}_Z^{\mathrm{T}}\left(-\frac{\pi}{2}\right) \boldsymbol{V}^{\mathrm{T}} \end{aligned}$