视觉slam十四讲学习笔记（1）

最新推荐文章于 2024-02-15 13:07:45 发布

it waits

最新推荐文章于 2024-02-15 13:07:45 发布

阅读量375

点赞数

本文链接：https://blog.csdn.net/itwaits/article/details/111144090

版权

slam概述

SLAM是搭载特定传感器的主体，在没有环境先验信息的情况下，于运动过程中建立环境的模型。

定位和建图可以看成感知的内外之分，一方面要明白自身的状态，另一方面也要了解外在的环境。
将传感器分为两类，一类传感器是携带与机器人本体上的，例如机器人的轮式编码器、相机、激光灯等。一类是安装于环境中的，例如导轨、二维码标志等。安装于环境中的传感设备，通常能够直接测量到机器人的位置信息，简单有效地解决定位问题。
但是，由于必须在环境中设置，在一定程度上限制了机器人的适用范围。
按照相机的工作方式，将相机分为单目、双目和深度相机（RGB-D）三个大类。

单目相机：只使用一个摄像头进行SLAM的做法称为单目SLAM。这种传感器结构特别简单，成本很低。
由于单目相机只是三维空间的二维投影，所以如果真想恢复三维结构，必须移动相机的视角。移动相机后，估计相机的运动，同时估计场景中的物体的远近和大小，称之为结构。
由于相机往右移动，图像中的东西就会往左移动，同时近处的物体移动块，远处的物体移动缓慢。于是，相机移动时，这些物体在图像上的运动，形成了视差，通过视差可以判断物体的远近。
但是对于单目相机，将相机的运动和场景同时放大一定的倍数，看到的景象是一样的。
这说明了单目SLAM估计的轨迹和地图，将于真实的相差一个因子，也就是所谓的尺度。由于单目SLAM无法仅凭图像确定这个真实尺度，又称为尺度不确定性。
单目的缺点：
平移后才能计算深度
无法计算真实的尺度
本质原因是通过单张图像无法确定深度

双目相机和深度相机
双目相机和深度相机的目的，在于通过某种手段测量物体离我们的距离，克服单目无法知道距离的缺点。
如果知道了距离，场景的三维结构就可以通过单个图像恢复出来，也就消除了尺度不确定性。

双目相机与深度相机测量深度的原理不同

双目相机由两个单目相机组成，这两个相机之间的距离也就是基线是已知的。我们通过基线来来估计每个像素的空间位置。
这类似于人类可以通过左右眼图像的差异，判断物体的远近。对于双目相机进行拓展，也可以搭建多目相机，但是本质原理相同。
双目相机对于计算量有很大的要求。且双目相机测量的深度范围与基线有关。基线距离越大，能测量的范围越远。

深度相机可以通过红外结构光或tof原理，像激光传感器一样，测出距离，相比于双目相机，极大的减少了计算量。但是目前也主要应用于室内，室外较难应用。

经典视觉slam框架

在这里插入图片描述
对目前的slam框架以及包含的算法来说。如果把工作环境限定在静态、刚体、光照变化不明显、没有人为干扰的场景，那么slam系统已经相当成熟了。

三维空间刚体运动

旋转矩阵

想要确定一个点的位置，首先要确定它所在的坐标系，确定坐标系后可以得到该线性空间的基，就可以根据此来确定该点在这组基下的坐标了。
在这里插入图片描述
当我们用该表示法表示出多点坐标之后，它们之间存在着多种计算方式，重要的有内积：

可以描述向量间的投影关系

还有外积：
在这里插入图片描述
外积只对三维向量存在定义，还能用外积表示向量的旋转。因为a到b之间的旋转关系，可以使用旋转向量来描述，也就是三个实数就可以刻画出旋转的状态。

与向量间的旋转类似，坐标系之间也存在着变换关系。
坐标系之间的转换关系运用矩阵T来描述。
相机运动是一个刚体运动，保证了同一个向量在各个坐标系长度和夹角都不会发生变化，这种变换称为欧式变换。
利用同一个点在不同坐标系中坐标表示不同，但是位置不会发生变化，建立等式，推导出如下式子：
在这里插入图片描述
得到了矩阵R，这个矩阵有两个坐标系的基的内积组成，只要旋转相同，那么矩阵R一定相同，所以它又被称为旋转矩阵。