1.问题
在纯视觉SLAM中存在尺度不确定的问题,而在视觉和IMU融合系统中很好的解决了这一问题。一直困扰我的是如何去理解SLAM中的尺度?尺度到底代表了什么?查阅了大量资料都没有一个明确的尺度定义,于是我开始从系统的整体,它可能会扮演的作用去猜测它,下面是我关于尺度通俗的理解:
2.尺度可以理解为深度或者说是两帧之间的位姿(R,t)以及深度等的信息。
3.理解
相机初始化的过程就是位姿和深度信息求解的过程。为什么说纯视觉SLAM存在尺度不确定问题?拿单目相机来说,使用2D-2D的方式来估计两帧相机,主要求解方法是基础矩阵,单应性矩阵以及BA等方式。但是在纯旋转情况下,也可以说是在平移t比较小的情况下基础矩阵的解算是失效的,通过单应性矩阵和BA的求解方式可以解析出旋转,但此时的求解出的平移是不可靠的。因此,也无法使用三角测距的方法来恢复地图点的深度。也就是,当只有在t足够大时,才能被解析,才能通过对极几何的方式恢复地图点的深度。
4.尺度确定
地图点的深度是和平移相关的,一个深度对应一个平移。为了能够检测出足够大的平移运动,在VIO系统中我们需要初始化过程,解析出t以及地图点的深度,并确定尺度。