思维导图
投影模型
根据观测方程建立目标函数
BA求解
根据非线性优化的思想,从某个初始值开始不断地寻找下降方向 ∆x 来找到目标函数的最优解。我们把自变量定义成所有待优化的变量(位姿和路标),然后不断增量求解:
目标函数变为:
其中 Fij 表示相机姿态的偏导数,而 Eij 表示路标点的偏导。写成矩阵的形式如下:
其中Xc为所有位姿项,Xp为所有路标项
根据前面的非线性优化求解,不管的是G-N法还是L-M法都面临下面的线性方程求解:
无论采用什么方法,其雅克比阵为:
以G-N法为例其H取H 是取 JT J, (L-M法的H为JT J + λI 的形式)
包含了所有的相机位姿和路标点所有的优化变量,这个线性方程的维度将非常大。直接对 H 求逆
来计算增量方程,由于矩阵求逆是复杂度为 O(n3) 的。
- 稀疏性
在 21 世纪早期,视觉领域研究者已经开始用 BA 进行重构,但通常认为包含大量特征点和位姿的 BA 计算量过大,不适合实时计算。直到近十年来,研究人员逐渐认识到 SLAM 问题中 的稀疏特性,才使它能够在实时场景中使用 。
H 阵是有J阵组成的(不管是G-N法还是L-M法)。考察一个误差项 eij,在 ξi 看到 pj,只涉及到第 i 个相机位姿和第 j 个路标点,对其余部分的变量的导数都为 0,如下:
我们设 Jij 只在 i, j 处有非零块,那么它对