一、研究背景
视觉SLAM需要获取世界坐标系中点的深度。
世界坐标系到像素坐标系的转换为(深度即Z):
深度的获取一共分两种方式:
a)主动式
RGB-D相机按照原理又分为结构光测距、ToF相机
ToF相机原理
b)被动
被动式无法精确得到点的深度值,因此存在深度的估计问题,按照主流相机的种类可以分为双目相机估计以及单目相机估计。
接下来详细介绍双目系统以及单目SLAM系统的深度估计问题
二、双目系统
双目相机模型如下图所示:
(图源《视觉SLAM十四讲》)
要计算深度z,需要已知世界坐标系中一点在左相机与右相机中对应的像素坐标UL与UR,即视差d。
获取d关键在于双目匹配,即左相机与右相机中的像素坐标对应的世界坐标系中的同一点。
举例:
ORB-SLAM2基于特征点获取视差:FAST特征点+BREIF算子。