SLAM视觉里程计的理解

河北一帆

已于 2023-04-14 14:49:27 修改

阅读量516

点赞数

文章标签： SLAM

于 2022-11-09 22:36:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41816368/article/details/127778375

版权

四种坐标系

SLAM中，用到四种坐标系：1、某点在现实世界坐标系中的坐标；2、点在相机坐标系中的坐标；3、归一化后的相机坐标（即Z=1，表示到相机距离为1的平面上的点的X、Y坐标）；4、像素二维坐标。

通过相机外参，即相机运动的旋转和平移，实现世界坐标系和相机坐标系的相互转化。通过相机内参，实现相机坐标系到像素坐标系的转化。相机内参在相机出厂后已经标定好，是已知量。SLAM求解的就是相机的外参，即相机的运动，以及点的世界坐标。

3D-3D：ICP

若RGB-D相机运动过程中拍下两张照片，根据相机内参，得到相机坐标系中的3D坐标（普通RGB相机内参转化后得到归一化的相机坐标，RGB-D相机根据深度，得到3D坐标）。这种问题称为3D-3D位姿估计问题，可以使用ICP（Iterative Closest Point）求解。求解ICP的非线性优化方法：

式中， ${p}'_{i}$ 为第一张图片中的点坐标，经过由李代数表示的相机旋转平移变换，理论上，应该与第二张图片中的点坐标 $p_{i}$ 重合，因此，使目标函数最小，求解最优李代数。

$exp(\xi ^{\wedge})= \begin{bmatrix} R & J\rho \\ 0^{T} & 1 \end{bmatrix}$

Gauss-Newton

这个非线性最优化问题，可以通过高斯牛顿法（Gauss-Newton）求解，思路如下：

对于最优化问题:

$min \frac{1}{2}\left \| f(x)) \right \|_{2}^{2}$

$x\in \mathbb{R}^{n}, f(x)\in \mathbb{R}^{m}$ ，自变量n维，目标函数m维，高斯牛顿法将其转化为：

$J(x)$ 是 $f(x)$ （注意不是 $f(x)^{2}$ ）的雅可比矩阵 m行n列。通过求解 $\Delta x$ ，迭代求解最优解。

误差对李代数的导

回归到ICP的非线性优化方法， $p_{i}-exp(\xi^\wedge){p}'_{i}$ 对李代数的导：（ps： $exp(\xi^\wedge)$ 就是变换矩阵T）

式中，R和t的取值：因为李代数是迭代求解，所以R和t就是当前迭代步的李代数对应的R和t。

ICP问题的雅可比矩阵就是 $(Tp)^{\odot }$ ，按照Gauss-Newton进行迭代求解，得到最优李代数。

3D-2D：PnP

有些时候，RGB-D相机不能有效得到深度，因此，不能得到3D坐标，只能得到2D坐标，即：第一张图片有深度，相机运动后拍摄的第二张图片没有深度，这种情况下，可以用PnP（Perspective-n-Point）方法求解。原理与ICP相似，区别在于：误差对李代数求导时，多了一步相机坐标系中空间坐标到像素坐标的链式法则，如下

雅可比矩阵有所不同。

2D-2D

即两张照片都没有深度信息，这种情况用经典的八点法求解本质矩阵，由本质矩阵得到R和t。这个方法就不涉及李代数了。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。