初识SLAM:
相机:将三维变为二维,但丢失了距离
分类:
单目:只有一个图像的时候无法知道深度,需移动相机产生深度-->近处的物体移动快、远处物体移动慢
双目:通过左右相机观测的视差估计距离(深度)--->计算量大
RGB(深度相机):物理方法计算深度-->量程小、易受干扰
整体SLAM(同时定位与地图构建)流程图:
传感器数据->前端(视觉里程计)->后端(非线性优化)->建图,及回环检测
里程计:这步到下步运动,通过两两图像估计局部运动,再将估计的局部运动叠加从而得到整个运动
不足:但局部环境下的估计使得误差也会累加,产生漂移
解决方法:
1.后端(非线性优化):全局的非线性优化,从带有噪声的数据中优化轨迹和地图,最大后验概率估计MAP
2.回环检测:一旦到了以前经过的位置,调整当前运动轨迹的估计
视觉里程计方法:
基于特征点法的视觉里程计
基于直接法的视觉里程计
后端优化:状态估计问题
从带有噪声的数据中优化轨迹和地图,最大后验概率估计MAP
前期以滤波器为主(梯度下降、高斯牛顿等),后期图优化(g2o)方法
回环检测:
检测机器人是否回到原先位置
识别到达过的场景
计算图像间相似性
方法:
词袋模型
建图:可用于导航、规划等
图像分类:度量地图、拓扑地图、稀疏地图、稠密地图
单目、双目建立稠密地图
运动方程和观测方程
位姿:由平移和旋转描述
三维空间 三个坐标系:世界坐标系、机器人坐标系、图像像素坐标系
位姿表示:由平移和旋转描述
1.旋转矩阵
2.旋转向量
3.欧拉角:万像锁
4.四元数
变换矩阵:包含旋转和平移
相机模型 三个坐标系:世界坐标系、相机坐标系、像素坐标系
小孔成像模型:相似三角形 相机焦距:成像平面到相机的距离
相机外参:变换矩阵-->旋转和平移
相机内参:标定目的确定相