视觉SLAM十四讲（1）

最新推荐文章于 2024-07-25 21:30:30 发布

汪汪队要加油呀

最新推荐文章于 2024-07-25 21:30:30 发布

阅读量431

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44053287/article/details/88804130

版权

本文介绍了视觉SLAM的基本概念和不同类型相机在SLAM中的应用，包括单目、双目和深度相机的优缺点。接着，概述了经典视觉SLAM框架的四个核心组成部分：视觉里程计、后端优化、回环检测和建图，并通过运动和观测方程阐述了SLAM问题的本质。最后提到了线性高斯系统与非线性非高斯系统的解决方法，以及当前主流的优化技术在状态估计中的优势。

摘要由CSDN通过智能技术生成

视觉SLAM十四讲（1）——初识SLAM

初识SLAM
经典视觉SLAM框架

初识SLAM

SLAM(simultaneous localization and mapping)，中文译作“同时定位与地图构建”。它是指搭载特定传感器的主体，在没有环境先验信息的情况下（不需要在环境中安装传感器），于运动过程中建立环境的模型，同时估计自己的运动。

如果这里的传感器主要为相机，以一定的速率拍摄周围的环境，形成一个连续的视频流，那么就称为“视觉SLAM”。

SLAM的目的是解决“定位”与“地图构建”这两个问题。也就是说，一边要估计传感器自身的位置，一边要建立周围环境的模型。

在什么地方？——定位（自身的状态）
周围环境是什么样？——建图（外在的环境）

单目相机——照片（三维空间的二维投影）：无法通过单张照片来计算场景中物体与我们之间的距离，因此必须移动相机改变其视角才能估计它的运动。当相机移动时，相片中的物体在图像上的运动就形成了视差。通过视差就能知道物体的远近，但这只是一个相对值，无法确定真实尺度，称为“尺度不确定性”。

双目相机——通过两个相机之间的距离（基线）来估计每个像素的空间位置。通过左右眼的差异，判断场景中物体与相机的距离。缺点是计算量大，消耗计算资源，与基线关系大（基线距离越大，能够测量到的就越远）。优点是既可以用在室内，亦可应用与室外。

深度相机——通过主动向物体发射光并接收返回的光，测出物体与相机之间的距离。优点是通过物理测量手段可节省大量的计算。缺点是主要用于室内，室外较难应用。

经典视觉SLAM框架

完整的SLAM系统分成“视觉里程计”、“后端优化”、“建图”以及“回环检测”。
SLAm流程图

1、传感器信息读取：相机图像信息的读取和预处理

2、视觉里程计：估算相邻图像间相机的运动，恢复场景的空间结构，以及局部地图的样子。会出现累计漂移问题（Drift），所以需要后端优化和回环检测来校正整个轨迹。（图像的特征提取与匹配等）

3、后端优化：后端接受不同时刻视觉里程计测量的相机位姿，以及回环检测的信息，对它们进行优化（消除噪声），得到全局一致的轨迹和地图。（滤波与非线性优化算法）

4、回环检测：解决位置估计随时间漂移的问题。判断相机是否到达过先前的位置。如果检测到回环，会把信息提供给后端进行处理。（计算图像数据相似性）

5、建图：根据估计的轨迹，建立与任务要求对应的地图。

SLAM过程可以总结为两个基本方程：

运动方程：
$x_k=f(x_{k-1},u_k,w_k)$

最低0.47元/天解锁文章

汪汪队要加油呀

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
视觉SLAM十四讲（1）

视觉SLAM十四讲（1）初识SLAM初识SLAM
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。