第二讲初识SLAM

喵喵不爱吃鱼

已于 2024-04-30 19:17:21 修改

阅读量222

点赞数 4

分类专栏：视觉SLAM十四讲文章标签：计算机视觉

于 2024-04-30 19:16:29 首次发布

本文链接：https://blog.csdn.net/weixin_42391513/article/details/138354679

版权

视觉SLAM十四讲专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1、SLAM 两大基本问题：定位、建图（定位和建图相互耦合：精确的定位需要精确的地图；精确的地图来自精确的定位）

2、SLAM传感器：

传感器有两类
- 安装于环境中（二维码 Marker、GPS、导航、磁条）
- 携带于机器人本体上（IMU、激光、相机）
SLAM更倾向使用携带式传感器是因为环境中的传感器限制了应用环境：
- 需要环境允许使用GPS、允许贴marker
- 而SLAM强调未知环境
- 更重视携带式传感器
SLAM激光传感器和相机传感器的优缺点
- 激光传感器优点：精确、快、研究成熟；
- 激光传感器缺点：重、贵
- 相机传感器优点：便宜、轻巧、信息丰富
- 相机传感器缺点：消耗更多的计算资源（视频流的解析）、需要在特定条件下才能工作（无遮挡、有纹理）

3、相机

分类：
- 单目 Monocular
- 双目 Stereo
- 深度 RGBD
- 其他鱼眼、全景、Event Camera
本质：以二维投影形式记录了三维世界的信息，丢掉了深度信息。
各类相机区别：有没有深度信息
- 单目：没有深度，必须通过移动相机产生深度（近处物体像运动快，远处物体运动慢），并且无法确定真实尺度
- 双目：通过视差计算深度（通过左右眼的差异，可以判断场景中物体离相机距离）
- RGBD：通过物理方法测量深度（主从测量功耗大，深度值较准确，量程小红外光室外容易受干扰，主要用于室内）
- 共同点：利用图像和场景的几何关系，计算相机运动和场景结构；三维空间的运动和结构；图像来自连续的视角

4、视觉SLAM模型

视觉里程计（Visual Odometry）:
- 相邻图像估计相机运动
- 基本形式：通过两张图像计算运动和结构
- 不可避免有漂移问题，局部估计累加，随着误差累积，存在不准的问题
- 方法：特征点法第七讲；直接法第八讲
后端优化
- 从带有噪声的数据中优化估计和地图状态估计问题
- 最大后验概率估计 MAP
- 方法：迁移以EKF（ExtendedKalmanFilter）为代表，想在以图优化为代表第十、十一讲
回环检测
- 检测机器人是否回到早先位置，全局校正
- 识别到达过的场景
- 计算图像间的相似性
- 方法：词袋模型第十二讲
建图
- 用于导航、规划、通讯、可视化、交互等
- 度量地图（强调精确标识地图中物体的位置关系） vs 拓扑地图（强调地图元素之间的关系）
  - 度量地图分类：稀疏地图（由路标组成） vs 稠密地图（着重建模所有看到的东西）
- 第十三讲
SLAM问题的数学描述
- 离散时间： t=1,2,...,k
- 萝卜位置：x1,x2,...xk （看成随机变量，服从概率分布）
- 萝卜是从上一时刻运动到下一时刻的，其运动方程： $x_k=f(x_{k-1} ,u_k,w_k)$ ， $u_k$ 为输入， $w_k$ 为噪声
- 路标（三维空间点，萝卜每个时刻观测到的东西）：y1,y2,...yn东西
- 传感器在位置xk处观测到了路标yj，观测方程： $z_{k,j}=h(x_k,y_j,v_{k,j})$ ，v_{k,j}是噪声
- 问题：位置是三维的，如何表述？（第三、四讲）；观测是相机中的像素点，如何表述（第五讲）；已知u,z，如何推断x,y（第六讲）

喵喵不爱吃鱼

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
第二讲初识SLAM

观测是相机中的像素点，如何表述（第五讲）；1、SLAM 两大基本问题：定位、建图（定位和建图相互耦合：精确的定位需要精确的地图；单目：没有深度，必须通过移动相机产生深度（近处物体像运动快，远处物体运动慢），并且无法确定真实尺度。三维空间的运动和结构；相机传感器缺点：消耗更多的计算资源（视频流的解析）、需要在特定条件下才能工作（无遮挡、有纹理）度量地图（强调精确标识地图中物体的位置关系） vs 拓扑地图（强调地图元素之间的关系）度量地图分类：稀疏地图（由路标组成） vs 稠密地图（着重建模所有看到的东西）
复制链接

扫一扫