VSLAM:一:VSLAM小科普

最新推荐文章于 2024-10-09 09:01:14 发布

Smart_zy

最新推荐文章于 2024-10-09 09:01:14 发布

阅读量2.6k

点赞数

分类专栏：计算机视觉

本文链接：https://blog.csdn.net/qq_40544338/article/details/119799945

版权

计算机视觉专栏收录该内容

12 篇文章 6 订阅

订阅专栏

一.目的

1.想知道：VSLAM小科普

1.将其转载，避免作者删除，就没有了

二.参考

1.VSLAM小科普

https://zhuanlan.zhihu.com/p/121601875

百度百科

三.注意

四.操作:备份

SLAM (Simultaneous Localization And Mapping，同步定位与地图构建)，主要为了解决移动机器人在未知环境运行时定位导航与地图构建的问题。

事实上，SLAM 并不是某一种特定的算法，而是一个概念。SLAM 涉及多种研究方向，每个方向里面才涉及到多种算法。SLAM 基于应用层面可分为激光 SLAM 和 Visual SLAM（简称 VSLAM），这篇文章所提及的就是 VSLAM，一种基于视觉的同步定位与地图构建。

碰巧最近在测试一款基于 VSLAM 的扫地机器人，所以查阅了一些资料。当然，这里不涉及具体的算法，真实情况是没能力讲解。里面涉及的算法对于我这个弱弱的本科生并不友好，所以只能根据资料提及一些概念性的东西。

VSLAM 框架

VSLAM 几乎都用一个基本的框架，这种 VSLAM 框架主要分为五个模块：传感器数据读取、前端、后端、建图和回环检测。大致流程如下图所示：

VSLAM 框架

VSLAM 之传感器数据

传感器除了惯性测量单元（Inertial measurement unit，简称IMU）之外，最重要的部件就是摄像头了。VSLAM 涉及到的摄像头主要有三种：单目摄像头、双目摄像头、RGB-D（深度图像）。

单目摄像头

单目摄像头拍摄的图像是二维的，无法得到深度信息（距离），所以我们无法通过单张图像计算场景中的物体与我们之间的距离。这确实是个难题，没有距离信息就无法定位和构建地图。

然而办法总比困难多。有人就想到一个好的解决方法。可以通过移动摄像头来改变摄像头的视角，根据“近处的物体移动快，远处的物体移动慢”这一原理，从而得知物体的远近，但这仍然是相对值，这种三维结构是不准确的，或者说是大概的。

虽然在获取深度信息上单目摄像头没什么优势，但在扫地机器人上装设单目摄像头却十分常见。常见的扫地机器人的摄像头是对准天花板的，这样环境比较固定且简单，有利于提取特征点。

有了摄像头后，能够很好的解决扫地机器人打滑无法定位的问题。

以往的扫地机器人获取定位信息只能信赖轮子，当扫地机器人打滑时轮子依然在转，然而机器并不知道自己已经打滑，在它看来还在正常走。

增加摄像头后，可以将图像信息与轮子信息结合起来判断。当轮子打滑时，扫地机器人知道轮子在正常走，但是通过图像知道机器并没有往前走，它会优先信赖图像上的信息，这样一来定位还是准确的。

下图是一款基于 VSLAM 的扫地机器人。

DJ35 扫地机器人

双目摄像头

双目摄像头由两个单目摄像头组成（两个摄像头之间的距离叫“基线”是已知的），通过所获得的两幅图像融合，直接计算出物体深度值，克服单目摄像头无法知道距离的缺点。具有成本低，能耗小，精度高等优势，所以被广泛的应用于 VSLAM 系统中。

虽然双目摄像头优势明显，但也存在一些缺陷。例如配置与标定较复杂，并且视差的计算非常消耗计算机资源。

下图是一个双目摄像头。

双目摄像头

RGB-D（深度图像）

深度图像 = 普通的 RGB 三通道彩色图像 + Depth Map

RGB-D 相机是新兴的视觉传感器，它可以同时获取周围环境的 RGB 图像和每个像素的深度（Depth）信息，相比于单目或双目利用算法计算空间点的三维坐标，RGB-D 相机获取空间点的 3D 信息更加直接，深度信息通过红外结构光或 TOF 原理测得，和激光雷达有些类似，被称为伪激光雷达。

TOF 相机

VSLAM 之前端

又称为视觉里程计（visual odometry，简称VO）。那什么是里程计呢？例如，我们在汽车轮胎上安装计数码盘，就可以得到轮胎转动的距离，从而得到汽车的估计。或者，也可以测量汽车的速度、加速度，通过时间积分来计算它的位移。完成这种运动估计的装置（包括硬件和算法）叫做里程计（Odometry）。

如果一个里程计主要依靠视觉传感器，比如单目、双目相机，我们就叫它视觉里程计。视觉里程计最主要的问题是如何从几个相邻图像中，估计相机的运动。相邻图像间的相似性，为我们估计相机运动提供了依据。