EPnP算法学习笔记

最新推荐文章于 2024-05-27 11:15:55 发布

dawuga

最新推荐文章于 2024-05-27 11:15:55 发布

阅读量908

点赞数 4

文章标签： slam

本文链接：https://blog.csdn.net/dawuga/article/details/118293426

版权

1.Overview

1.1 算法输入：

2D-3D关联点对，具体数据结构形式如下所示：
$p a i r < p 2 d, p 3 d >$

1.2 算法输出：

旋转矩阵R（3x3），平移向量T(3x1)，旋转矩阵R表示当前坐标系与目标坐标系之间的旋转，平移向量T表示当前坐标系与目标坐标系之间的平移。在下文中称当前坐标系为世界坐标系，称坐标系为相机坐标系。

2. 符号说明

n个3D点在世界坐标系中的坐标，其坐标形式为非齐次坐标
$p^w_i = \begin{bmatrix} x_i^w \\ y_i^w\\ z_i^w \end{bmatrix}, i = 1, \cdots n$
n个3D点在相机坐标系中的坐标，其坐标形式为非齐次坐标
$p^c_i = \begin{bmatrix} x_i^c \\ y_i^c \\ z_i^c \end{bmatrix}, i = 1, \cdots n$
n个2D点坐标，其坐标形式为非齐次坐标
$\bf{u_i} = \begin{bmatrix} u_i \\ v_i \end{bmatrix}, i = 1, \cdots n$
4个控制点在世界坐标系中的坐标，其坐标形式为非齐次坐标
$c^w_i = \begin{bmatrix} x_i^w \\ y_i^w\\ z_i^w \end{bmatrix}, i = 1,2,3,4$
4个控制点在相机坐标系中的坐标，其坐标形式为非齐次坐标
$c^c_i = \begin{bmatrix} x_i^c \\ y_i^c \\ z_i^c \end{bmatrix}, i = 1,2,3,4$
我们用上标 $w$ 和 $c$ 来表示该坐标所在坐标系为世界坐标还是相机坐标

3. 理论推导

3.1 控制点的引入

EPnP算法中引入4个控制点，使得世界坐标系每一个3D点坐标都可以被4个控制点坐标的线性组合表示
$p^w_i = \sum^4_{j=1} a_{ij}c^w_i \tag{1}$
将4个控制点看成一个坐标系的基，我们称这个坐标系为齐次重心坐标系 (homogeneous barycentric coordinate system)，后续我们将称之为hb坐标，至于为什么叫这个名字将在后面介绍。我们可以得到每个3D点在该坐标系下的hb坐标为
$hb(p^w_i) = \begin{bmatrix} a_{i1} \\ a_{i2} \\ a_{i3}\\ a_{i4} \end{bmatrix} \tag{2}$
3D点相机坐标系下的坐标可由其在世界坐标系下的坐标旋转平移得到
$\begin{bmatrix} p^c_i \\ 1 \end{bmatrix} = \begin{bmatrix} R & T \\ 0 & 1 \end{bmatrix} \begin{bmatrix} p^w_i \\ 1 \end{bmatrix} \tag{3}$
将(2)带入(3)
$\begin{bmatrix} p^c_i \\ 1 \end{bmatrix} = \begin{bmatrix} R & T \\ 0 & 1 \end{bmatrix} \sum^4_{j=1} a_{ij} \begin{bmatrix} c^w_i \\ 1 \end{bmatrix} = \begin{bmatrix} R & T \\ 0 & 1 \end{bmatrix} \begin{bmatrix} \sum^4_{j=1} a_{ij}c^w_i \\ \sum^4_{j=1} a_{ij} \end{bmatrix} \tag{4}$
我们将（4）变换为如下形式
$\begin{bmatrix} p^c_i \\ 1 \end{bmatrix} = \sum^4_{j=1} a_{ij} \begin{bmatrix} R & T \\ 0 & 1 \end{bmatrix} \begin{bmatrix} c^w_i \\ 1 \end{bmatrix} = \sum^4_{j=1} a_{ij} \begin{bmatrix} c^c_i \\ 1 \end{bmatrix} \tag{5}$
我们比较（5）和（1）发现，3D点的坐标在世界坐标系中hb坐标和相机坐标系中的hb坐标是一致的，这一点非常重要
在上述的公式中，我们还可以从（4）中得到
$\sum^4_{j=1} a_{ij} = 1 \tag{6}$
这是hb坐标的一个限制条件

3.2 hb坐标的计算

我们可以把（1）写成齐次坐标的形式，并用矩阵相乘的方式来表示
$\begin{bmatrix} p^w_i \\ 1 \end{bmatrix} = \underbrace{ \begin{bmatrix} c^w_1 & c^w_2 & c^w_3 & c^w_4\\ 1 &1 & 1& 1 \end{bmatrix} }_{\text{C}} \begin{bmatrix} a_{i1} \\ a_{i2} \\ a_{i3}\\ a_{i4} \end{bmatrix} \tag{7}$
我们只需要两边乘以 $C^{-1}$ 即可获得hb坐标
$\begin{bmatrix} a_{i1} \\ a_{i2} \\ a_{i3}\\ a_{i4} \end{bmatrix} = \begin{bmatrix} c^w_1 & c^w_2 & c^w_3 & c^w_4\\ 1 &1 & 1& 1 \end{bmatrix}^{-1} \begin{bmatrix} p^w_i \\ 1 \end{bmatrix} \tag{8}$

3.3 控制点的构造

理论上控制点可以随便构造，只需要满足 $C$ 可逆即可，但是为了算法的稳定性，算法的原论文 [1]中提出一种构造控制点的方式，第一个控制点采用所有3D点世界坐标的质心
$c^w_1 = \frac 1 n \sum_{i=1}^np^w_i \tag{9}$
其余的控制点，我们将选用这些3D点的三个主方向上，需要对这些数据进行主成分分析（PCA）
$\bf{A}= \begin{bmatrix} (p^w_1 - c^w_1)^T \\ (p^w_2 - c^w_1)^T \\ \cdots \\ (p^w_n - c^w_1)^T \end{bmatrix} \tag{10}$
计算 $\bf{A^T}\bf{A}$ 的三个特征值 $\lambda_1,\lambda_2,\lambda_3$ ，以及对应三个特征向量 $\bf{v_1},\bf{v_2},\bf{v_3}$ ，那么剩余3个控制点可表示为
$\begin{cases} c^w_2 = c^w_1 + \sqrt{ \frac{\lambda_1}{n}} \bf{v_1} \\ c^w_3 = c^w_1 + \sqrt{ \frac{\lambda_2}{n}} \bf{v_2} \\ c^w_4 = c^w_1 + \sqrt{ \frac{\lambda_1}{n}} \bf{v_3} \end{cases} \tag{11}$
上述操作实际上是找到点云的重心，以及点云的三个主方向

3.4 解析求解

在相机投影模型下，有如下等式成立
$\begin{bmatrix} \bf{u_i} \\ 1 \end{bmatrix} = K p_i^c = K \sum_{j=1}^4 a_{ij} c^c_i \tag{12}$
我们将（12）展开
$\begin{bmatrix} u_i \\ v_i \\ 1 \end{bmatrix} = \underbrace{ \begin{bmatrix} f_u & 0 & u_0 \\ 0 & f_v & v_0 \\ 0 & 0 & 1 \end{bmatrix} }_{\text{K}} \sum_{j=1}^4 a_{ij} \begin{bmatrix} x_j^c \\ y_j^c \\ z_j^c \end{bmatrix} \tag{13}$
继续展开可以得到
$\begin{bmatrix} s u_i \\ s b_i \\ s \end{bmatrix} = \begin{bmatrix} \sum_{j=1}^4 a_{ij}(f_u x^c_j + u_0z^c_j) \\ \sum_{j=1}^4 a_{ij}(f_v y^c_j + u_0z^c_j) \\ \sum_{j=1}^4 a_{ij} z^c_j \end{bmatrix} \tag{14}$
将（14）的第3行带入上面2行可以消去s，就可以构造下面的方程
$\begin{cases} \sum_{j=1}^4 a_{ij} \lbrack f_ux_j^c + (u_0-u_i)z^c_j \rbrack = 0\\ \sum_{j=1}^4 a_{ij} \lbrack f_vy_j^c + (v_0-v_i)z^c_j \rbrack = 0\\ \end{cases} \tag{15}$
一个点我们可以构造如（15）的两个方程，如果是n个点我们可以写成如下矩阵形式
$\small{ \underbrace{ \begin{bmatrix} a_{11}f_u & 0 & a_{11}(u_0-u_1) & a_{12}f_u & 0 & a_{12}(u_0-u_1) & a_{13}f_u & 0 & a_{13}(u_0-u_1) & a_{14}f_u & 0 & a_{14}(u_0-u_1) \\ 0 & a_{11}f_v & a_{11}(v_0-v_1) & 0 & a_{12}f_v & a_{12}(v_0-v_1) & 0 & a_{13}f_v & a_{13}(v_0-v_1)& 0 & a_{14}f_v & a_{14}(v_0-v_1) \\ \vdots & \vdots & \vdots &\vdots &\vdots &\vdots &\vdots &\vdots &\vdots &\vdots &\vdots &\vdots & \\ a_{n1}f_u & 0 & a_{n1}(u_0-u_1) & a_{n2}f_u & 0 & a_{n2}(u_0-u_1) & a_{n3}f_u & 0 & a_{n3}(u_0-u_1) & a_{n4}f_u & 0 & a_{n4}(u_0-u_1) \\ 0 & a_{n1}f_v & a_{n1}(v_0-v_1) & 0 & a_{n2}f_v & a_{n2}(v_0-v_1) & 0 & a_{n3}f_v & a_{n3}(v_0-v_1)& 0 & a_{n4}f_v & a_{n4}(v_0-v_1) \\ \end{bmatrix} }_{\text{M}} \underbrace{ \begin{bmatrix} x_1^c\\ y_1^c\\ z_1^c\\ x_2^c\\ y_2^c\\ z_2^c\\ x_3^c\\ y_3^c\\ z_3^c\\ x_4^c\\ y_4^c\\ z_4^c\\ \end{bmatrix} }_{\text{x}} =0 }$
我们可以上面这个巨大的矩阵等式写成如下简单的形式
$\bf{M}\bf{x} = 0 \tag{16}$
我们要解出控制点在相机坐标系下的坐标也就是要求 $\bf{M}$ 的零空间，可以用奇异值分解，奇异值分解复杂度过高，我们发现下面这个式子和（16）是同解的
$\bf{M^T}\bf{M}\bf{x} = 0 \tag{17}$
我们只需要求 ${\bf{M^T}\bf{M}}_{12 \times12}$ 特征值为零及其对应特征向量 $v_i, i = 1,2\cdots N$ (这里假设值为零的特征值有N个)，则4个控制点在相机坐标系下的坐标可以表示为 $N$ 个 $v_i$ 向量的线性组合
$\bf{x} = \sum_{i=1}^N \beta_i v_i \tag{18}$
我们要求出4个控制点在相机坐标系下的坐标，就需要求出解出（18）中的 $N$ 个 $\beta_i$ 的值，但是原论文[1]中作者根据实验得出，N的取值与相机的焦距有关，如下图所示，随着焦距变长，末尾的4个特征值（最小的4个特征值），趋近于0。所以我们在实现的时候直接取最小的4个特征值及其特征值向量（显然由于各种噪声和误差，不可能解出特征值为0），即我们取 $N$ =4
在这里插入图片描述

想要求出 $\beta_1,\beta_2,\beta_3,\beta_4$ ，我们还需要利用一个约束：由于控制点坐标经过旋转和平移从世界坐标系到相机坐标系，控制点之间的欧式距离并不发生改变
$\left\|c^c_i - c^c_j\right\|_2^2 = \left\|c^w_i - c^w_j\right\|_2^2 \tag{19}$
$c^c_i = \beta_1 v_1^{[i]} + \beta_2 v_2^{[i]} + \beta_3 v_3^{[i]}+\beta_4 v_4^{[i]} \tag{20}$
这里 $v^{[i]}$ 表示 $v_{12 \times 1}$ 的第 $i$ 个 $\times 1$ 的子向量，然后我们将（20）带入（19）得到
$\small{ \left\| \beta_1 v_1^{[i]} + \beta_2 v_2^{[i]} + \beta_3 v_3^{[i]}+\beta_4 v_4^{[i]} - \beta_1 v_1^{[j]} - \beta_2 v_2^{[j]} - \beta_3 v_3^{[j]}-\beta_4 v_4^{[j]} \right\|_2^2 = \left\|c^w_i - c^w_j\right\|_2^2 }$
将上面的式子整理一下可以得到
$\small{ \left\| \beta_1 \underbrace{(v_1^{[i]}-v_1^{[j]})}_{s_1} + \beta_2 \underbrace{(v_2^{[i]}-v_2^{[j]})}_{s_2}+ \beta_3 \underbrace{(v_3^{[i]}-v_3^{[j]})}_{s_3}+\beta_4 \underbrace{(v_4^{[i]}-v_4^{[j]})}_{s_4} \right\|_2^2 = \left\|c^w_i - c^w_j\right\|_2^2 \tag{21} }$
根据 $i$ 和 $j$ 的不同取值（21）这样等式可以构造 $C_4^2=6$ 个，将（21）展开可得
$\left\|c^w_i - c^w_j\right\|_2^2= \beta_1^2 s_1^Ts_1 + \beta_1 \beta_2 s_2^Ts_1+ \beta_1 \beta_3 s_3^Ts_1 + \beta_1 \beta_4 s_4^Ts_1 \cdots+ \beta_4 \beta_4 s_4^Ts_4 \tag{22}$
将6个等式写成矩阵形式如下所示(其中 $\beta_{ij}=\beta_i\beta_j$ , $s_{ij}$ 表示第 $i$ 个等式的 $s_j$ )
$\small{ \underbrace{ \begin{bmatrix} s_{11}^Ts_{11}& s_{11}^Ts_{12} & s_{12}^Ts_{12} & s_{11}^Ts_{13} & s_{12}^Ts_{13} & s_{13}^Ts_{13} & s_{11}^Ts_{14} & s_{12}^Ts_{14} & s_{13}^Ts_{14} & s_{14}^Ts_{14} \\ s_{21}^Ts_{21}& s_{21}^Ts_{22} & s_{22}^Ts_{22} & s_{21}^Ts_{23} & s_{22}^Ts_{23} & s_{23}^Ts_{23} & s_{21}^Ts_{24} & s_{22}^Ts_{24} & s_{23}^Ts_{24} & s_{24}^Ts_{24} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots &\vdots\\ s_{61}^Ts_{61}& s_{61}^Ts_{62} & s_{62}^Ts_{62} & s_{61}^Ts_{63} & s_{62}^Ts_{63} & s_{63}^Ts_{63} & s_{61}^Ts_{64} & s_{62}^Ts_{64} & s_{63}^Ts_{64} & s_{64}^Ts_{64} \\ \end{bmatrix} }_{L} \underbrace{ \begin{bmatrix} \beta_{11} \\ \beta_{12} \\ \beta_{22} \\ \beta_{13} \\ \beta_{23} \\ \beta_{33} \\ \beta_{14} \\ \beta_{24} \\ \beta_{34} \\ \beta_{44} \\ \end{bmatrix} }_{\beta} = \underbrace{ \begin{bmatrix} \left\|c^w_1 - c^w_2 \right\|_2^2 \\ \left\|c^w_1 - c^w_2 \right\|_2^2 \\ \left\|c^w_2 - c^w_2 \right\|_2^2 \\ \left\|c^w_1 - c^w_3 \right\|_2^2 \\ \left\|c^w_2 - c^w_3 \right\|_2^2 \\ \left\|c^w_3 - c^w_3 \right\|_2^2 \\ \left\|c^w_1 - c^w_4 \right\|_2^2 \\ \left\|c^w_2 - c^w_4 \right\|_2^2 \\ \left\|c^w_3 - c^w_4 \right\|_2^2 \\ \left\|c^w_4 - c^w_4 \right\|_2^2 \\ \end{bmatrix} }_{\rho} }$
我们将上面的巨大的矩阵等式下面这种简单的形式
$L\beta=\rho \tag{23}$
取其中几列构造新的方程可以获得原方程的近似解， $\beta_1,\beta_2,\beta_3,\beta_4$ 的初值，用于后续的高斯牛顿优化的初始值
$\small{ \begin{bmatrix} s_{11}^Ts_{11}& s_{11}^Ts_{12} & s_{11}^Ts_{13} &s_{11}^Ts_{14} \\ s_{21}^Ts_{21}& s_{21}^Ts_{22} & s_{21}^Ts_{23} &s_{21}^Ts_{24} \\ \vdots & \vdots & \vdots & \vdots & \\ s_{61}^Ts_{61}& s_{61}^Ts_{62} & s_{61}^Ts_{73} &s_{71}^Ts_{74} \\ \end{bmatrix} \begin{bmatrix} \beta_{11} \\ \beta_{12} \\ \beta_{13} \\ \beta_{14} \\ \end{bmatrix} = \begin{bmatrix} \left\|c^w_1 - c^w_2 \right\|_2^2 \\ \left\|c^w_1 - c^w_2 \right\|_2^2 \\ \left\|c^w_2 - c^w_2 \right\|_2^2 \\ \left\|c^w_1 - c^w_3 \right\|_2^2 \\ \left\|c^w_2 - c^w_3 \right\|_2^2 \\ \left\|c^w_3 - c^w_3 \right\|_2^2 \\ \left\|c^w_1 - c^w_4 \right\|_2^2 \\ \left\|c^w_2 - c^w_4 \right\|_2^2 \\ \left\|c^w_3 - c^w_4 \right\|_2^2 \\ \left\|c^w_4 - c^w_4 \right\|_2^2 \\ \end{bmatrix} \tag{24} }$
构造下面的目标优化函数
$\argmin_{\beta} Error(\beta) = \sum (L\beta-\rho)^2 \tag{25}$
记残差项为
$\bf{r}= L \beta-\rho \tag{26}$
优化变量为
$\bf{x}= \begin{bmatrix} \beta_1 \\ \beta_2 \\ \beta_3 \\ \beta_4 \\ \end{bmatrix}$
残差项对优化变量的雅克比矩阵
$\bf{J} = \frac {\partial \bf{r}}{\partial \bf{x}} =L \frac {\partial \beta}{\partial \bf{x}} = L \begin{bmatrix} \frac {\partial \beta_{11}}{\partial \beta_1} & \frac {\partial \beta_{11}}{\partial \beta_2} & \frac {\partial \beta_{11}}{\partial \beta_3} & \frac {\partial \beta_{11}}{\partial \beta_4} \\ \frac {\partial \beta_{12}}{\partial \beta_1} & \frac {\partial \beta_{12}}{\partial \beta_2} & \frac {\partial \beta_{12}}{\partial \beta_3} & \frac {\partial \beta_{12}}{\partial \beta_4} \\ \frac {\partial \beta_{22}}{\partial \beta_1} & \frac {\partial \beta_{22}}{\partial \beta_2} & \frac {\partial \beta_{22}}{\partial \beta_3} & \frac {\partial \beta_{22}}{\partial \beta_4} \\ \frac {\partial \beta_{13}}{\partial \beta_1} & \frac {\partial \beta_{13}}{\partial \beta_2} & \frac {\partial \beta_{13}}{\partial \beta_3} & \frac {\partial \beta_{13}}{\partial \beta_4} \\ \frac {\partial \beta_{23}}{\partial \beta_1} & \frac {\partial \beta_{23}}{\partial \beta_2} & \frac {\partial \beta_{23}}{\partial \beta_3} & \frac {\partial \beta_{23}}{\partial \beta_4} \\ \frac {\partial \beta_{33}}{\partial \beta_1} & \frac {\partial \beta_{33}}{\partial \beta_2} & \frac {\partial \beta_{33}}{\partial \beta_3} & \frac {\partial \beta_{33}}{\partial \beta_4} \\ \frac {\partial \beta_{14}}{\partial \beta_1} & \frac {\partial \beta_{14}}{\partial \beta_2} & \frac {\partial \beta_{14}}{\partial \beta_3} & \frac {\partial \beta_{14}}{\partial \beta_4} \\ \frac {\partial \beta_{24}}{\partial \beta_1} & \frac {\partial \beta_{24}}{\partial \beta_2} & \frac {\partial \beta_{24}}{\partial \beta_3} & \frac {\partial \beta_{24}}{\partial \beta_4} \\ \frac {\partial \beta_{34}}{\partial \beta_1} & \frac {\partial \beta_{34}}{\partial \beta_2} & \frac {\partial \beta_{34}}{\partial \beta_3} & \frac {\partial \beta_{34}}{\partial \beta_4} \\ \frac {\partial \beta_{44}}{\partial \beta_1} & \frac {\partial \beta_{44}}{\partial \beta_2} & \frac {\partial \beta_{44}}{\partial \beta_3} & \frac {\partial \beta_{44}}{\partial \beta_4} \\ \end{bmatrix} \tag{27}$
增量方程为
$\bf{J^T}\bf{J} \Delta x = \bf{-J^T} \bf{r} \tag{28}$
更新优化变量
$\bf{x} = \bf{x} + \Delta x \tag{28}$
至此，我们已经得到了控制点在相机坐标系的坐标，3D点由于hb坐标在相机坐标系和世界坐标中是一致的，所以我们可以根据（5）还原出每个3D点在相机坐标系中的坐标，这样就把PnP问题转化成了ICP问题，根据ICP问题的算法我们可以解出旋转矩阵 $R$ 和平移向量 $T$ ，本文就不在继续介绍其解法。

4. 参考资料

[1] Lepetit, V.; Moreno-Noguer, F.; Fua, P. Epnp: Efficient perspective-n-point camera pose estimation. International Journal of Computer Vision 2009, 81, 155-166.
[2] PnP问题之EPnP解法
[3] EPnP算法
[4] 高翔, 张涛, 颜沁睿, 刘毅, 视觉SLAM十四讲：从理论到实践, 电子工业出版社, 2017

dawuga

关注

4
点赞
踩
13

收藏

觉得还不错? 一键收藏
5
评论
EPnP算法学习笔记

1.Overview1.1 算法输入：2D-3D关联点对，具体数据结构形式如下所示：pair<p2d,p3d> pair<p2d, p3d>pair<p2d,p3d>1.2 算法输出：旋转矩阵R（3x3），平移向量T(3x1)，旋转矩阵R表示当前坐标系与目标坐标系之间的旋转，平移向量T表示当前坐标系与目标坐标系之间的平移。在下文中称当前坐标系为世界坐标系，称坐标系为相机坐标系。2. 符号说明n个3D点在世界坐标系中的坐标，其坐标形式为非齐次坐标piw=
复制链接

扫一扫