Bundle Adjustment原理及应用

最新推荐文章于 2022-11-02 11:14:28 发布

晚餐男孩

最新推荐文章于 2022-11-02 11:14:28 发布

阅读量2.9k

点赞数 9

分类专栏： SLAM 文章标签： slam BA

本文链接：https://blog.csdn.net/shanpenghui/article/details/112600080

版权

SLAM 专栏收录该内容

26 篇文章 20 订阅

订阅专栏

虽然现在的轮子很多，但我们在使用过程中会碰到很多问题，而我们经常不知道从哪里下手，说明轮子不是你造的你不熟悉。因此我们不仅要重复造轮子，还要好好造，深入造，才能用好轮子，把轮子转化成自身的力量。同样的道理适用于这篇文章。虽然网上BA的资料无穷无尽，但我们还是要好好深入理解其原理，并且一定要通过实践才能懂得其中原理。在"第一届SLAM论坛"中沈劭劼老师的发言中，他提到团队的成员都要手写BA，既然大佬都这么做，我们就照做吧。这篇文章是我手写BA的笔记，主要从原理推导入手，把公式都写一遍，然后通过g2o、ceres和eigen三种方式来编程实现，以便加深对BA的理解。本文所有例子代码参见https://github.com/shanpenghui/BA_exercise.git

一、前言

Bundle Adjustment中文译作光束平差法、捆集调整等，是指从视觉重建中提炼出最优的3D模型和相机参数（内参和外参）。从每个特征点反射出来的几束光线（bundles of light rays），在我们把相机姿态和特征点的位置做出最优的调整（adjustment）之后，最后收束到光心的这个过程，简称BA。

二、原理

现假设空间位置的3D点为

$\begin{matrix} X = \left\{ x_{1},x_{2},\ldots,x_{n} \right\} \end{matrix} \tag{1}$

相机中心位姿为

$\begin{matrix} P = \left\{ p_{1},p_{2},\ldots,p_{n} \right\} \end{matrix} \tag{2}$

$u_{i}$ 为 $x_{i}$ 对应的像素位置， $K$ 为相机内参矩阵， $s_{i}$ 为 $u_{i}$ 对应的深度值。如图，BA要计算的误差是观测值和估计值之间的误差。

对于bundle adjustment可以构建重投影误差最小二乘如下：

$\begin{matrix} \varepsilon\left( X,T \right) = \sum_{i = 0}^{n}\left| \left| u_{i} - \frac{1}{s_{i}}K \cdot T{\cdot X}_{i} \right| \right|^{2} \end{matrix} \tag{3}$

对于变换矩阵T，满足如下约束：

$\begin{matrix} T = \begin{bmatrix} \text{R\ t} \\ 0^{T}\ 1 \\ \end{bmatrix},R^{T} \cdot R = I,\det\left( R \right) = 1,t \in \mathbb{R}^{3} \end{matrix} \tag{4}$

对于有约束的变换矩阵在最小二乘中不好求解，转换为无约束的李群求解：

$\begin{matrix} \varepsilon\left( X,\xi \right) = \sum_{i = 0}^{n}{||u_{i} - \frac{1}{s_{i}}K \cdot exp(\xi^{\land}){\cdot X}_{i}||}^{2} \end{matrix} \tag{5}$

其中， $\xi$ 是旋转向量(李代数)， $\xi^{\hat{}}$ 是旋转向量的矩阵表达， $exp(\xi^{\hat{}})$ 表达从向量(李代数)到矩阵(李群)的对数映射。

定义误差函数为：

$\begin{matrix} f\left( X_{i},\xi \right) = u_{i} - K \cdot \exp\left( \xi^{\hat{}} \right){\cdot X}_{i} \end{matrix} \tag{6}$

对于高斯牛顿，函数 $f\left( x \right)$ 的 $x$ 变量指的就是函数 $f\left( X_{i},\xi \right)$ 里面的 $\left( X_{i},\xi \right)$ 。根据该方法，有增量方程：

$\begin{matrix} {J\left( x \right)}^{T} \cdot J\left( x \right) \cdot \mathrm{\Delta}x = - {J\left( x \right)}^{T} \cdot f\left( x \right) \end{matrix} \tag{7}$

从增量方程可以看到，我们需要计算函数 $f (x)$ 的Jacobian矩阵，根据求导链式法则，要对多变量进行求导，最终表示为对 $\left( X_{i},\xi \right)$ 的 $\left( X_{i} \right)$ 求导，以及对 $\left( X_{i},\xi \right)$ 的 $\left( \xi \right)$ 求导。

函数对变量 $\left( \xi \right)$ 进行求导，即重投影误差函数 $f\left( X_{i},\xi \right)$ 对相机位姿 $\left( \xi \right)$ 求导：

$\begin{matrix} \frac{\partial f\left( X_{i},\xi \right)}{\partial\xi} = \begin{bmatrix} \frac{f_{x}}{z}\ 0 - \frac{f_{x}x}{z^{2}} \\ 0\ \frac{f_{y}}{z}\ - \frac{f_{y}y}{z^{2}} \\ \end{bmatrix} \cdot R \end{matrix} \tag{8}$

函数对变量 $\left( X_{i} \right)$ 进行求导，即重投影误差函数 $f\left( X_{i},\xi \right)$ 对坐标点 $\left( X_{i} \right)$ 求导：

$\begin{matrix} \frac{\partial f\left( X_{i},\xi \right)}{\partial X_{i}} = \begin{bmatrix} \frac{f_{x}}{z}\ 0 - \frac{f_{x}x}{z^{2}}\ - \frac{f_{x}xy}{z^{2}}\ f_{x}\left( 1 + \frac{x^{2}}{z^{2}} \right)\ - \frac{f_{x}y}{z} \\ 0\ \frac{f_{y}}{z}\ - \frac{f_{y}y}{z^{2}}\ {- f}_{y}\left( 1 + \frac{y^{2}}{z^{2}} \right)\ \frac{f_{y}xy}{z^{2}}\ \frac{f_{y}x}{z} \\ \end{bmatrix} \end{matrix} \tag{9}$

三、必备知识

1.SO(3)的对数映射 Exponential Map

李群和李代数的映射关系为：

$\begin{matrix} exp:\mathfrak{\text{so}}\left( 3 \right)\ \mapsto SO\left( 3 \right) \end{matrix} \tag{10}$

$\begin{matrix} \omega\ \ \ \ \ \ \ \mapsto \ R_{3 \times 3} \end{matrix} \tag{11}$

转换成罗格里格式公式表示为：

$\begin{matrix} e^{\omega} \equiv matexp\left( \omega^{\land} \right) = I_{3} + \frac{\text{sinθ}}{\theta} \cdot \omega^{\land} + 1 - \frac{\text{cosθ}}{\theta^{2}} \cdot \left( \omega^{\land} \right)^{2} \end{matrix} \tag{12}$

其中， $\omega$ 是3维的旋转向量，表示为
$\omega = \begin{bmatrix} x \\ y \\z \end{bmatrix}$ ， $\theta$ 是旋转角度，表示为 $\theta = |\omega|$ ， $\omega^{\land}$ 是旋转向量 $\omega$ 的反对称矩阵，表示为
$\omega^{\land} = \begin{bmatrix} 0 & - z & y \\ z & 0 & - x \\- y & x & 0 \\ \end{bmatrix}$ 。

2.向量外积

两个向量的叉积其实就是这个反对称矩阵的来源，比如：

$\begin{matrix} \overrightarrow{a} \times \overrightarrow{b} = \begin{bmatrix} i & j & k \\ a_{1} & a_{2} & a_{3} \\ b_{1} & b_{2} & b_{3} \\ \end{bmatrix} = \begin{bmatrix} a_{2}b_{3} - a_{3}b_{2} \\ a_{3}b_{1} - a_{1}b_{3} \\ a_{1}b_{2} - a_{2}b_{1} \\ \end{bmatrix} = \begin{bmatrix} 0 & - a_{3} & a_{2} \\ a_{3} & 0 & - a_{1} \\ -a_{2} & a_{1} & 0 \\ \end{bmatrix}\overrightarrow{b} \equiv a^{\land}b \end{matrix} \tag{13}$

所以，上述旋转向量 $\omega$ 的反对称矩阵 $\omega^{\land}$ 表达的是其和单位向量之间的叉积，也叫外积，一般来说，向量的外积表示向量的旋转。

3.SO(3)的Jacobian

根据公式(12)，SO3的对数映射的导数是：

$\begin{matrix} \left. \ \frac{\partial e^{\omega}}{\partial\omega} \right|_{\omega = 0} \equiv \left. \ \frac{\partial{vec(e}^{\omega})}{\partial\omega} \right|_{\omega = 0} = \begin{bmatrix} -e_{1}^{\land} \\ -e_{2}^{\land} \\ -e_{3}^{\land} \\ \end{bmatrix}\ \ \ \ (A\ 9 \times 3\ Jacobian) \end{matrix} \tag{14}$

4.SE(3)的对数映射 Exponential Map

设有6维的李代数 $\mathfrak{\text{se}}(3)$ 为 $\nu$ ，表示为

$\begin{matrix} \nu = \begin{bmatrix} t \\ \omega \\ \end{bmatrix} \end{matrix} \tag{15}$

$\nu$ 分为2个3维向量，其中 $\omega$ 表示旋转向量， $t$ 表示平移向量，我们进一步假设由李代数 $\mathfrak{\text{se}}(3)$ 为 $\nu$ 映射出来的李群，即变换矩阵为 $A$ ，则 $A$ 表示为：

$\begin{matrix} A\left( \nu \right) = \begin{bmatrix} \omega^{\land}\text{\ t} \\ 0\ \ 0 \\ \end{bmatrix} \end{matrix} \tag{16}$

通过李代数到李群的对数映射有：

$\begin{matrix} exp:\mathfrak{\text{se}}\left( 3 \right)\ \mapsto SE\left( 3 \right) \end{matrix} \tag{17}$

那么，李代数 $\mathfrak{\text{se}}(3)$ 为 $\nu$ 的对数表示为：

$\begin{matrix} e^{\nu} \equiv e^{A\left( \nu \right)} = \begin{bmatrix} e^{\omega^{\land}}\text{\ Vt} \\ 0\ \ \ 1 \\ \end{bmatrix} \end{matrix} \tag{18}$

其中 $V$ 表示为：

$\begin{matrix} V = I_{3} + \frac{1 - cos\theta}{\theta^{2}} \cdot \omega^{\land} + \frac{\theta - sin\theta}{\theta^{3}} \cdot \left( \omega^{\land} \right)^{2} \end{matrix} \tag{19}$

其中， $\omega$ 是3维的旋转向量，表示为 $\omega = \begin{bmatrix}x \\y \\z \\ \end{bmatrix}$ ， $\theta$ 是旋转角度，表示为 $\theta = |\omega|$ ， $\omega^{\land}$ 是旋转向量 $\omega$ 的反对称矩阵，表示为 $\omega^{\land} = \begin{bmatrix} 0 & - z & y \\ z & 0 & - x \\ -y & x & 0 \\ \end{bmatrix}$ 。

5.SE(3)的Jacobian

根据公式(18)，当李代数坐标 $\varepsilon = 0$ 的时候，SE3的对数映射的导数是：

$\begin{matrix} \left. \ \frac{\partial e^{\varepsilon}}{\partial\varepsilon} \right|_{\varepsilon = 0} \equiv \left. \ \frac{\partial{vec(e}^{\varepsilon})}{\partial\varepsilon} \right|_{\varepsilon = 0} = \begin{bmatrix} 0_{3 \times 3} & - e_{1}^{\land} \\ 0_{3 \times 3} & - e_{2}^{\land} \\ 0_{3 \times 3} & - e_{3}^{\land} \\ I_{3 \times 3} & 0_{3 \times 3} \\ \end{bmatrix}\ \ \ \ (A\ 12 \times 6\ Jacobian) \end{matrix} \tag{20}$

其中， $e_{1}^{\land} = \begin{bmatrix} 1 & 0 & 0 \\ \end{bmatrix}^{T}$ ， $e_{2}^{\land} = \begin{bmatrix} 0 & 1 & 0 \\ \end{bmatrix}^{T}$ ， $e_{3}^{\land} = \begin{bmatrix} 0 & 0 & 1 \\ \end{bmatrix}^{T}$ 。而 $\varepsilon$ 可以为很小的值，比如 $\varepsilon = \begin{bmatrix} \text{dx} & \text{dy} & \text{dz} & \omega^{T} \\ \end{bmatrix}^{T}$ 。

6. $\mathbf{\bigotimes}$ (Kronecker operator)的含义

设现有矩阵A和B，其纬度分别是 $M_{A} \times N_{A}$ 和 $M_{B} \times N_{B}$ ，那么其进行 $\bigotimes$ 运算的结果是一个 ${M_{A}M}_{B} \times N_{B}N_{A}$ 的矩阵，表示为：

$\begin{matrix} A\bigotimes B = \begin{bmatrix} a_{11}\text{B\ }a_{12}\text{B\ }a_{13}B\ \cdots \\ a_{21}\text{B\ }a_{22}\text{B\ }a_{23}B\ \cdots \\ \cdots \\ \end{bmatrix} \end{matrix} \tag{21}$

其中， $\begin{bmatrix} a_{11}\ a_{12}\ a_{13}\ \cdots \\ a_{21}\ a_{22}\ a_{23}\ \cdots \\ \cdots \\ \end{bmatrix}$

7.Pose-Pose的Jacobian

现有 $p_{1}$ 和 $p_{2}$ 两个位姿，那么位姿的叠加是 $p_{1}\bigoplus p_{2}$ ，也可以表示成 $f_{\bigoplus}(p_{1},p_{2}) \in SE(3) \times SE(3) \mapsto SE(3)$ ，即两个 $S E (3)$ 叠加之后成为新的 $S E (3)$ ，现在要利用 $f_{\bigoplus}(p_{1},p_{2})$ 对 $p_{1}$ 求导，则表示为：

$\begin{matrix} \frac{\partial f_{\bigoplus}\left( p_{1},p_{2} \right)}{\partial p_{1}} \end{matrix} \tag{22}$

该表达式想表达什么呢？假如 $p_{i}$ 是标量，那该表达式就变成简单的一维求导公式。但现在 $p_{i}$ 是向量，那么该表达式变成Jacobian矩阵。实际上，任何不可逆的 $\times 4$ 矩阵 $T$ 都属于流形 $\in GL(4,\mathbb{R)}$ ，可理解为任何不可逆的变换矩阵 $\left\lbrack \right\rbrack \in GL(4,\mathbb{R)}$ 。既然公式(23)也是位姿，那我们需要用参数来展开它以便理解它。一般来说，我们很容易理解，位姿可以用矩阵的形式来表达，那么在处理矩阵导数的时候，我们都会隐含地假定一个事实，就是所有涉及的矩阵实际上都是由向量展开的，这也表明矩阵的导数都是标准的Jacobian矩阵。注意到一点，在我们用矩阵描述刚体运动的时候，我们只用到 $\times 4$ 的部分（即R和t，下面的 $0_{3 \times 3}$ 和1都不用）。

那么，在位姿求导的公式(23)中，位姿用 $\times 4$ 矩阵来表达。
但当它用向量展开之后，最后一行是被忽略的。位姿变成12个向量。虽然这表明一个6自由度的实体过度参数化了，但通过这样的表达，很多重要的步骤变成线性的了，使得我们可以更加有效地获取精确的导数。我们用T代替p，则公式(23)表示成：

$\begin{matrix} \frac{\partial f_{\bigoplus}\left( p_{1},p_{2} \right)}{\partial p_{1}} = \frac{\partial f_{\bigoplus}\left( T_{1},T_{2} \right)}{\partial T_{1}} \end{matrix} \tag{23}$

其结果可表示成：

$\begin{matrix} M = \end{matrix} \tag{24}$

把f设为F，根据上式则有：

$\begin{matrix} \frac{\partial f_{\bigoplus}\left( p_{1},p_{2} \right)}{\partial p_{1}} = \frac{\partial F\left( P,Q \right)}{\partial P} = \frac{\partial vec\left( F\left( P,Q \right) \right)}{\partial vec\left( P \right)} \\ = \frac{\partial\left\lbrack f_{11}f_{21}f_{31}f_{12}f_{22}\cdots f_{33}f_{14}f_{24}f_{34} \right\rbrack}{\partial\left\lbrack p_{11}p_{21}p_{31}p_{12}p_{22}\cdots p_{33}p_{14}p_{24}p_{34} \right\rbrack} \\ = \begin{bmatrix} \frac{\partial f_{11}}{\partial p_{11}} & \cdots & \frac{\partial f_{11}}{\partial p_{34}} \\ \vdots & \ddots & \vdots \\ \frac{\partial f_{34}}{\partial p_{11}} & \cdots & \frac{\partial f_{34}}{\partial p_{34}} \\ \end{bmatrix}_{12 \times 12} \end{matrix} \tag{25}$

根据以上理解，我们计算 $\partial f_{\bigoplus}\left( p_{1},p_{2} \right)$ 的偏导：

$\begin{matrix} \frac{\partial f_{\bigoplus}\left( p_{1},p_{2} \right)}{\partial p_{1}} = \frac{\partial f_{\bigoplus}\left( T_{1},T_{2} \right)}{\partial T_{1}} = {T_{2}}^{T}\bigotimes I_{3} \end{matrix}\tag{26}$

$\begin{matrix} \frac{\partial f_{\bigoplus}\left( p_{1},p_{2} \right)}{\partial p_{2}} = \frac{\partial f_{\bigoplus}\left( T_{1},T_{2} \right)}{\partial T_{2}} = {I_{4}\bigotimes R}_{A} \end{matrix}\tag{27}$

记住公式(26)，待会要用来计算左乘模型的Jacobian矩阵。

8. $\mathbf{D \boxplus \varepsilon =}\mathbf{e}^{\mathbf{\varepsilon}}\mathbf{\bigoplus D}$ 的Jacobian

假设现在有位姿 $\in SE(3)$ ，那么其变换矩阵T为：

$\begin{matrix} T\left( D \right) = \left\lbrack \right\rbrack \end{matrix}\tag{28}$

我们利用左乘的扰动模型，可知我们的问题描述为对 $\mathbf{e}^{\mathbf{\varepsilon}}\mathbf{\bigoplus D}$ 的结果进行求导，则位姿对扰动的偏导数表示为：

$\begin{matrix} \left. \ \frac{\partial e^{\varepsilon}D}{\partial\varepsilon} \right|_{\varepsilon = 0} = \left. \ \frac{\partial AD}{\partial A} \right|_{A = I_{4} = e^{\varepsilon}} \cdot \left. \ \frac{\partial e^{\varepsilon}}{\partial\varepsilon} \right|_{\varepsilon = 0} \end{matrix}\tag{29}$

其中，根据公式(26)可得：

$\begin{matrix} \left. \ \frac{\partial AD}{\partial A} \right|_{A = I_{4} = e^{\varepsilon}} = {T\left( D \right)}^{T}\bigotimes I_{3} \end{matrix}\tag{30}$

根据公式(20)可得：

$\left. \ \frac{\partial e^{\varepsilon}}{\partial\varepsilon} \right|_{\varepsilon = 0} \equiv \left. \ \frac{\partial{vec(e}^{\varepsilon})}{\partial\varepsilon} \right|_{\varepsilon = 0} = \begin{bmatrix} 0_{3 \times 3} & - e_{1}^{\land} \\ 0_{3 \times 3} & - e_{2}^{\land} \\ 0_{3 \times 3} & - e_{3}^{\land} \\ I_{3 \times 3} & 0_{3 \times 3} \\ \end{bmatrix}$

所以，最终公式(29)结果是：

$\begin{matrix} \left. \ \frac{\partial e^{\varepsilon}D}{\partial\varepsilon} \right|_{\varepsilon = 0} = \left\lbrack {T\left( D \right)}^{T}\bigotimes I_{3} \right\rbrack \cdot \begin{bmatrix} 0_{3 \times 3} & - e_{1}^{\land} \\ 0_{3 \times 3} & - e_{2}^{\land} \\ 0_{3 \times 3} & - e_{3}^{\land} \\ I_{3 \times 3} & 0_{3 \times 3} \\ \end{bmatrix} = \begin{bmatrix} 0_{3 \times 3} & - d_{c1}^{\land} \\ 0_{3 \times 3} & - d_{c2}^{\land} \\ 0_{3 \times 3} & - d_{c3}^{\land} \\ I_{3} & - d_{t}^{\land} \\ \end{bmatrix} \end{matrix}\tag{31}$

该公式接下用来计算重投影误差函数 $f\left( X_{i},\xi \right)$ 对相机位姿 $\left( \xi \right)$ 里面的式子。

9.Pose-Point的Jacobian

假设现有坐标点 $\in \mathbb{R}^{3}$ ，其位姿是 $\in SE(3)$ ，则重投影 $g_{\bigoplus}\left( D,p \right)$ 之后，其对位姿和点的偏导为：

$\begin{matrix} \frac{\partial g_{\bigoplus}\left( D,p \right)}{\partial p} = \frac{\partial D\bigoplus p}{\partial p} = \frac{\partial(Rp + t)}{\partial p} = R \end{matrix}\tag{32}$

$\begin{matrix} \frac{\partial g_{\bigoplus}\left( D,p \right)}{\partial D} = \frac{\partial D\bigoplus p}{\partial D} = {(p^{T}\ 1)\bigotimes I}_{3} \end{matrix}\tag{33}$

10. $\mathbf{e}^{\mathbf{\varepsilon}}\mathbf{\bigoplus D\bigoplus}\mathbf{p}$ 的Jacobian

假设现有坐标点 $\in \mathbb{R}^{3}$ ，其位姿是 $\in SE(3)$ ，那么其变换矩阵是：

$\begin{matrix} T\left( D \right) = \left\lbrack \right\rbrack \end{matrix}\tag{34}$

该问题则转换成重投影误差函数对位姿的求导，利用公式(33)和(31)，结果为：

$\left. \ \frac{\partial\left( e^{\varepsilon}D \right)\bigoplus p}{\partial\varepsilon} \right|_{\varepsilon = 0} = \left. \ \frac{\partial A\bigoplus p}{\partial A} \right|_{A = e^{\varepsilon}D = D}{\cdot \left. \ \frac{\partial e^{\varepsilon}D}{\partial\varepsilon} \right|}_{\varepsilon = 0} = \frac{\partial D\bigoplus p}{\partial D}{\cdot \left. \ \frac{\partial e^{\varepsilon}D}{\partial\varepsilon} \right|}_{\varepsilon = 0}$

$\left( {\left( p^{T}\ 1 \right)\bigotimes I}_{3} \right) \cdot \begin{bmatrix} 0_{3 \times 3} & - d_{c1}^{\land} \\ 0_{3 \times 3} & - d_{c2}^{\land} \\ 0_{3 \times 3} & - d_{c3}^{\land} \\ I_{3} & - d_{t}^{\land} \\ \end{bmatrix}$

$\begin{matrix} = \left( I_{3}\ - \ \left\lbrack D\bigoplus p \right\rbrack^{\land} \right)\ \ (A\ 3 \times 6\ Jacobian) \end{matrix}\tag{35}$

四、推导

1.针孔相机的投影函数

假设针孔相机的内参矩阵是K，则有：

$\begin{matrix} K = \begin{bmatrix} f_{x} & 0 & c_{x} \\ 0 & f_{y} & c_{y} \\ 0 & 0 & 1 \\ \end{bmatrix} \end{matrix} \tag{36}$

有投影函数 $h:\mathbb{R}^{3} \mapsto \mathbb{R}^{2}$ ，点 ${\lbrack p_{x}\ p_{y}\ p_{z}\rbrack}^{T}$ 在相机上的像素坐标 $(u, v)$ 是：

$\begin{matrix} h\left( p \right) = h\begin{pmatrix} p_{x} \\ p_{y} \\ p_{z} \\ \end{pmatrix} = \begin{pmatrix} c_{x} + \frac{f_{x}p_{x}}{p_{z}} \\ c_{y} + \frac{f_{y}p_{y}}{p_{z}} \\ \end{pmatrix} \end{matrix}\tag{37}$

投影函数h对点p求导：

$\begin{matrix} \frac{\partial h\left( p \right)}{\partial p} = \begin{bmatrix} \frac{f_{x}}{p_{z}} & 0 & - \frac{f_{x}p_{x}}{{p_{z}}^{2}} \\ 0 & \frac{f_{y}}{p_{z}} & - \frac{f_{y}p_{y}}{{p_{z}}^{2}} \\ \end{bmatrix} \end{matrix}\tag{38}$

2.三维坐标点p重投影函数的偏导数

上述的点p重投影问题可描述为：已知位姿 $\in SE(3)$ ，和一些与该位姿相关的坐标点 $\in \mathbb{R}^{3}$ （即可通过该位姿投影之后得到对应的像素点 $p^{'} = A\bigoplus p$ ，称之为我们估计值，实际值则是相机图片上我们提取出来的像素点 $p_{o}$ ），那么该问题变成函数 $h(e^{\varepsilon}\bigoplus A\bigoplus p)$ ，要解非线性解，就要对该函数进行求导，由函数变量可知我们需要对A和p进行求导，首先对p求导，则：

$\frac{\partial h\left( e^{\varepsilon}\bigoplus A\bigoplus p \right)}{\partial p} = \left. \ \frac{\partial h\left( p^{'} \right)}{\partial p^{'}} \right|_{p^{'} = A\bigoplus p = g} \cdot \frac{\partial e^{\varepsilon}\bigoplus A\bigoplus p}{\partial p}$

$\begin{matrix} = \left. \ \frac{\partial h\left( p^{'} \right)}{\partial p^{'}} \right|_{p^{'} = A\bigoplus p = g} \cdot \frac{\partial A\bigoplus p}{\partial p} \end{matrix}\tag{39}$

根据公式(38)和(32)，由(39)可得：

$\begin{matrix} \frac{\partial h\left( e^{\varepsilon}\bigoplus A\bigoplus p \right)}{\partial p} = \begin{bmatrix} \frac{f_{x}}{g_{z}} & 0 & - \frac{f_{x}g_{x}}{{g_{z}}^{2}} \\ 0 & \frac{f_{y}}{g_{z}} & - \frac{f_{y}g_{y}}{{g_{z}}^{2}} \\ \end{bmatrix} \cdot R_{A}\ \ (A\ 2 \times 3\ Jacobian) \end{matrix}\tag{40}$

重投影误差函数对坐标点的偏导数最终表达式已求得。再对位姿A求导，则：

$\begin{matrix} \frac{\partial h\left( e^{\varepsilon}\bigoplus A\bigoplus p \right)}{\partial\varepsilon} = \left. \ \frac{\partial h\left( p^{'} \right)}{\partial p^{'}} \right|_{p^{'} = A\bigoplus p = g} \cdot \frac{\partial e^{\varepsilon}\bigoplus A\bigoplus p}{\partial\varepsilon} \end{matrix}\tag{41}$

根据公式(35)，由(41)可得：

$\frac{\partial h\left( e^{\varepsilon}\bigoplus A\bigoplus p \right)}{\partial\varepsilon} = \begin{bmatrix} \frac{f_{x}}{g_{z}} & 0 & - \frac{f_{x}g_{x}}{{g_{z}}^{2}} \\ 0 & \frac{f_{y}}{g_{z}} & - \frac{f_{y}g_{y}}{{g_{z}}^{2}} \\ \end{bmatrix} \cdot \left( I_{3}\ - \ \left\lbrack A\bigoplus p \right\rbrack^{\land} \right)$

$\begin{bmatrix} \frac{f_{x}}{g_{z}} & 0 & - \frac{f_{x}g_{x}}{{g_{z}}^{2}} \\ 0 & \frac{f_{y}}{g_{z}} & - \frac{f_{y}g_{y}}{{g_{z}}^{2}} \\ \end{bmatrix} \cdot \left( I_{3}\ - \ \left\lbrack g \right\rbrack^{\land} \right)$

$\begin{matrix} \frac{\partial h\left( e^{\varepsilon}\bigoplus A\bigoplus p \right)}{\partial\varepsilon} = \begin{bmatrix} \frac{f_{x}}{g_{z}} & 0 & - \frac{f_{x}g_{x}}{{g_{z}}^{2}} & - \frac{f_{x}g_{x}g_{y}}{{g_{z}}^{2}} & f_{x}\left( 1 + \frac{{g_{x}}^{2}}{{g_{z}}^{2}} \right) & - \frac{f_{x}g_{y}}{g_{z}} \\ 0 & \frac{f_{y}}{g_{z}} & - \frac{f_{y}g_{y}}{{g_{z}}^{2}} & - f_{y}\left( 1 + \frac{{g_{y}}^{2}}{{g_{z}}^{2}} \right) & \frac{f_{y}g_{x}g_{y}}{{g_{z}}^{2}} & \frac{f_{y}g_{x}}{g_{z}} \\ \end{bmatrix}\ (A\ 2 \times 6\ Jacobian) \end{matrix}\tag{42}$

函数对位姿的偏导数最终表达式已求得。

至此，函数的偏导数已求取完毕，分别是公式(40)和(42)。

五、g2o应用

这部分在g2o文件夹里面。现有外参 $R, t$ ，用李代数 $\xi$ 表示，像素坐标 $\left( u_{i},v_{i} \right)$ 用 $z$ 表示，三维世界的路标点 ${\lbrack x,y,z\rbrack}^{T}$ ，用 $p$ 表示，那么误差函数为：

$\begin{matrix} e = z - h\left( \xi,p \right) \end{matrix}\tag{43}$

其中， $h ()$ 是上面讲的相机投影函数。

那么，利用公式(40)和(42)，误差对 $\xi$ 的偏导数是(注意前面有个负号)：

$\begin{matrix} \frac{\partial e}{\partial\xi} = \frac{\partial\left( z - h\left( \xi,p \right) \right)}{\partial\xi} = - \frac{\partial h\left( e^{\varepsilon}\bigoplus A\bigoplus p \right)}{\partial\varepsilon} = - \begin{bmatrix} \frac{f_{x}}{g_{z}} & 0 & - \frac{f_{x}g_{x}}{{g_{z}}^{2}} & - \frac{f_{x}g_{x}g_{y}}{{g_{z}}^{2}} & f_{x}\left( 1 + \frac{{g_{x}}^{2}}{{g_{z}}^{2}} \right) & - \frac{f_{x}g_{y}}{g_{z}} \\ 0 & \frac{f_{y}}{g_{z}} & - \frac{f_{y}g_{y}}{{g_{z}}^{2}} & - f_{y}\left( 1 + \frac{{g_{y}}^{2}}{{g_{z}}^{2}} \right) & \frac{f_{y}g_{x}g_{y}}{{g_{z}}^{2}} & \frac{f_{y}g_{x}}{g_{z}} \\ \end{bmatrix} \end{matrix}\tag{44}$

误差对 $p$ 的偏导数是(注意前面有个负号)：

$\begin{matrix} \frac{\partial e}{\partial p} = \frac{\partial\left( z - h\left( \xi,p \right) \right)}{\partial p} = - \frac{\partial h\left( e^{\varepsilon}\bigoplus A\bigoplus p \right)}{\partial p} = - \begin{bmatrix} \frac{f_{x}}{g_{z}} & 0 & - \frac{f_{x}g_{x}}{{g_{z}}^{2}} \\ 0 & \frac{f_{y}}{g_{z}} & - \frac{f_{y}g_{y}}{{g_{z}}^{2}} \\ \end{bmatrix} \cdot R_{A} \end{matrix}\tag{45}$

特别注意的是，g2o里面和上面推导公式的区别有两个地方：

统一用 $f$ 来表示 $f_{x}$ 和 $f_{y}$ ；
g2o旋转在前，平移在后，和公式(15)是反的。

因此，最终g2o应用的公式是：

$\begin{matrix} \frac{\partial e}{\partial\xi} = - \begin{bmatrix} -\frac{fg_{x}g_{y}}{{g_{z}}^{2}} & f\left( 1 + \frac{{g_{x}}^{2}}{{g_{z}}^{2}} \right) & - \frac{fg_{y}}{g_{z}} & \frac{f}{g_{z}} & 0 & - \frac{fg_{x}}{{g_{z}}^{2}} \\ -f\left( 1 + \frac{{g_{y}}^{2}}{{g_{z}}^{2}} \right) & \frac{fg_{x}g_{y}}{{g_{z}}^{2}} & \frac{fg_{x}}{g_{z}} & 0 & \frac{f}{g_{z}} & - \frac{fg_{y}}{{g_{z}}^{2}} \\ \end{bmatrix} \end{matrix}\tag{46}$

$\begin{matrix} \frac{\partial e}{\partial p} = - \begin{bmatrix} \frac{f}{g_{z}} & 0 & - \frac{fg_{x}}{{g_{z}}^{2}} \\ 0 & \frac{f}{g_{z}} & - \frac{fg_{y}}{{g_{z}}^{2}} \\ \end{bmatrix} \cdot R_{A} \end{matrix}\tag{47}$

六、ceres应用

这部分在ceres文件夹里面。之前ceres用的不多，总结一下其使用步骤：

构建cost fuction，即代价函数。
通过代价函数构建待求解的优化问题。
配置求解器参数并求解问题。

针对公式(43)提出的问题，定义一个类，里面包含有观测值和估计值，最重要的是误差计算（ceres里面常用重载运算符来实现），然后利用该类生成代价函数，最终求解问题。

这里要说一下，ceres例子用的是AutoDiffCostFunction，即自动计算导数，所以不用自己去求导。其他的看代码就清楚了。

七、Eigen应用

这部分在eigen文件夹里面。只用Eigen就比较痛苦了，数据结构、Jacobian、高斯牛顿等都要自己一步步理解和实现，也踩了一些坑，最后还是完成了，不过过多展开，具体看代码好了，有几点强调：

所有的实现都只优化了pose，没有优化point；
高斯牛顿的步骤要记牢，根据理论的步骤一步步来，不要贪心；
Jacobian和deltase3的纬度和对应关系要搞清，否则会晕，导致中途放弃；
求解出来的deltase3的旋转和平移顺序要注意，参考公式(15)，否则会导致错误的结果。

八、总结

总体来说，g2o比较经典，容易让人理解，但有一定工程量，性能也不如ceres。Ceres实现起来最方便，不用过多关注细节，可快速开发。手写工程量就很大，性能最差，但可以让人上手，加深对BA的理解。本文所有例子代码参见https://github.com/shanpenghui/BA_exercise.git，代码中的refs文件夹有关于非线性优化库的性能指标的一些论文，感兴趣的可自行查阅。

晚餐男孩

关注

9
点赞
踩
31

收藏

觉得还不错? 一键收藏
打赏
1
评论
Bundle Adjustment原理及应用

作者：晚餐男孩虽然现在的轮子很多，但我们在使用过程中会碰到很多问题，而我们经常不知道从哪里下手，说明轮子不是你造的你不熟悉。因此我们不仅要重复造轮子，还要好好造，深入造，才能用好轮子，把轮子转化成自身的力量。同样的道理适用于这篇文章。虽然网上BA的资料无穷无尽，但我们还是要好好深入理解其原理，并且一定要通过实践才能懂得其中原理。在“第一届SLAM论坛”中沈劭劼老师的发言中，他提到团队的成员都要手写BA，既然大佬都这么做，我们就照做吧。这篇文章是我手写BA的笔记，主要从原理推导入手，把公式都写一遍，然后通过
复制链接

扫一扫