视觉SLAM——视觉里程计解决方案分析（间接法）

最新推荐文章于 2024-09-11 10:49:04 发布

宅男不宅

最新推荐文章于 2024-09-11 10:49:04 发布

阅读量674

点赞数

分类专栏： SLAM 文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38023849/article/details/107430307

版权

SLAM 专栏收录该内容

5 篇文章 1 订阅

订阅专栏

目录

基本问题分析
各类求解方案
优缺点分析

基本问题

视觉里程计是视觉SLAM技术的起点，其核心问题同SLAM技术一样，主要是定位与构图，但视觉里程计解决的核心是定位问题，也就是相机的位姿。通俗地讲就是利用多张图像信息还原相机的运动。
在这里插入图片描述
以两帧图像为例。设空间点 $P$ 为路标点， $p_1,p_2$ 为图像上的投影点。其中 $p_1,p_2$ 为两帧图像正确匹配的特征点， $O_1,O_2$ 为图像的坐标系。
在 $O_1$ 中， $P$ 点坐标为 $X_1,Y_1,Z_1)$ ， $p_1$ 的坐标为 $u_1,v_1,z_1)$ 。
同理，在 $O_2$ 中， $P$ 点坐标为 $X_2,Y_2,Z_2)$ ， $p_1$ 的坐标为 $u_2,v_2,z_2)$ 。
同时。坐标系 $O_1,O_2$ 之间的欧式变换矩阵为 $R$ (旋转)， $t$ （平移）。
视觉里程计（直接法）的基本问题可描述为，在已知或部分已知上述坐标的情况下，求解 $R$ ， $t$ 。
根据不同的已知信息，分为以下不同的解决方案。

各类求解方案

方案一：仅仅采集二维图像（2D-2D）（单目相机）

已知条件： $p_1(x_1,y_1)，p_2(x_2,y_2)$ 。注意z未知.

求解方案：对极约束，求解 $E=t^\wedge R$ ，如何对 $E$ 进行SVD分析，还原出 $t, R$ 。利用三角测量（三角化）可得到 $P$ 点的深度信息。

方案二：已知部分三维图像（2D-3D）（双目相机 or D-RGB相机）

已知条件： $p_1(x_1,y_1,z_1)，p_2(x_2,y_2)$ 。注意 $z_2$ 未知，此类问题称为 $P n P$ 问题

求解方案1：对于 $P n P$ 问题的求解方法有很多，如：直接线性变换，BA优化等。当总的来说都是直接求解 $R, t$ 。

求解方案2：求解 $z_2$ ，得到图像的全部三维信息，转换为ICP问题（3D-3D）。求解 $z_2$ 的方法称为 $P 3 P$ 。

方案三：已知全部三维图像（3D-3D）（双目相机 or D-RGB相机）

已知条件： $p_1(x_1,y_1,z_1)，p_2(x_2,y_2,z_2)$ 。此类问题称为 $I C P$ 问题。

解决方案：SVD分解，BA优化；

这里特意提一下BA优化，这是一种同用的非线性优化方法，在SLAM中应用非常广泛。

优缺点分析

对极约束对于采集图像的硬件要求低，有着较低的成本，但是求解得到 $R, t$ 有着尺度问题，需要在一开始对 $t$ 进行归一化。与此同时，需要利用三角测量才能知道特征点的深度信息。

PnP与ICP问题在SLAM中常常混合出现，因为采集的图像可能出现部分图像没有深度信息。因此，采用双目或RGB-D相机避免了尺度问题，但增加了硬件成本。

在这里插入图片描述

参考文献：https://blog.csdn.net/u014709760/article/details/88059000

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。