A Survey on Active Simultaneous Localization and Mapping: State of the Art and New Frontiers(关于主动同时定位与建图的研究:现状与新前沿)
0. 摘要
- 主动 SLAM 是通过规划和控制机器人的运动来建立精确且完整的周围环境模型的问题
- 将主动 SLAM 问题解耦为识别、选择和执行潜在导航动作的三个阶段
1. 引言
- 主动 SLAM 可以看作是机器人选择自己未来控制动作的决策过程
- 在探索新区域和利用已经看到的区域之间进行平衡,以提高生成的环境地图模型的准确性
- 主动 SLAM 的应用示例:危险环境下的搜救,地下或行星探测
1.1 历史视角
-
定位、建图和规划往往结合在一起进行研究,产生了 SLAM、主动定位、主动建图和主动 SLAM 等多个研究领域
-
SLAM 是一种被动的方法,并不关心如何引导导航过程,而主动的方法则考虑导航问题
-
Cowan and Kovesi 和 Aloimonos 等人最先研究并分析主动感知(主动信息获取)问题;Bajcsy 后来正式将其定义为:为了实现某一目标而主动获取数据的问题,这其中必然涉及一个决策过程,对于目标是改进定位、建图或两者都有的情况,分别将问题称为主动定位、主动建图和主动SLAM
- 主动建图
- 主动建图是第一个被解决的问题,主动建图作为下一个最佳视图(next best view)问题而广为人知,它处理的问题是:搜索最优运动以创建周围环境的最佳表示/展现
- 主动定位
- 主动定位的目的是:在已知环境地图的情况下,通过确定机器人应该如何运动来改进对机器人位姿的估计
- 主动 SLAM
- 主动 SLAM 允许机器人在最初未知的环境中自主运行,它是主动感知在 SLAM 中的应用,可定义为:控制正在进行 SLAM 的机器人以最小化其定位和地图表示的不确定性的问题
历史上关于主动 SLAM 有不同的定义与术语:如
- active exploration(主动探索)
- adaptive exploration(自适应探索)
- integrated exploration(综合探索)
- autonomous SLAM(自主 SLAM)
- simultaneous planning, localization and mapping(同时规划、定位与建图)
- belief-space planning (信念空间规划,BSP)
- simply robotic exploration(单纯的机器人探索)
最后 Davison and Murray 统一称为主动 SLAM
- 主动建图
-
为了解决机器人探索问题,研究者必须根据预期的成本和收益在两个相反的原则之间切换:探索新的领域和重新审视已经看到的领域,即所谓的探索-利用困境(所谓探索:是指做你以前从来没有做过的事情,以期望获得更高的回报;所谓利用:是指做你当前知道的能产生最大回报的事情)
1.2 以往的主动SLAM综述
- Past, present, and future of simultaneous localization and mapping: Toward the robust-perception age
- Active mapping and robot exploration: A survey
2. 主动 SLAM 问题描述
2.1 问题公式化(略)
- 经过一定的特殊化处理后,主动 SLAM 可以基于更广泛的部分可观测马尔科夫决策过程(POMDPs)的数学框架
2.2 主动 SLAM 问题解耦
-
- Identification of the potential actions(潜在动作识别)
-
- Utility computation(效用计算)
-
- Action selection and execution(动作选择与执行)
然而,这种解耦会产生次优结果并导致不期望的行为
3. 阶段一:潜在动作识别
- 作用:生成机器人可以执行(即机器人能够达到的目标)的可用动作集合,这可以理解为减少(和离散化)潜在动作的搜索空间的方式
- 早期的工作只是简单地使用随机目标或者需要人为交互,直到 Yamauchi 引入了frontiers(边界)的概念,改进了探索策略并成为最常见的方法,随后还出现了基于神经网络的新方法用于评估潜在目标空间
在这一部分,介绍了识别目标位置最重要的方法,由于它们依赖于 SLAM 估计的环境表示,因此首先简要描述主动 SLAM 的现有环境表示方法
3.1 环境表示方法
-
拓扑地图
- 拓扑地图使用轻量级图来描述环境的拓扑结构信息
- 这些图的构建是一个分割问题,通常在占据栅格上完成
- 该环境表示方法在主动 SLAM 中使用频率不高
-
度量地图
- 度量地图是主动 SLAM 中最常用的编码环境信息的表示
- 可以进一步分为稀疏和稠密地图
- 稀疏地图:依靠一组稀疏的兴趣点(或地标)来表示一个场景
- 稠密地图:可以基于点云、网格,或者将环境离散化为编码一定度量(如占有率、到障碍物的距离等)的单元格
- 主动 SLAM 中常用的几类度量地图:占据栅格地图(2D)、八叉树地图(3D)、点云地图(3D)、体素地图(3D)等
-
度量-语义图
- 将语义信息与经典度量地图相关联
-
混合和层次地图
- Rosinol 等人将度量、语义和拓扑表示结合成一个单一的模型,即三维场景图。这些层次化的表示将度量-语义地图分解为相互关联的高层实体
- 混合地图在主动 SLAM 中的使用大多是未开发的
3.2 检测目标位置
- Random exploration(随机探索)
- 最简单的方法是随机选择目标目的地:随机探索需要较低的计算资源,并且在假设环境中的每个点都有相同的信息关联的前提下工作
- frontier-based exploration(基于边界探索)
- 是迄今为止使用最多的方法,并针对不同的地图表示进行了定制
- 方法
- wavefront frontier detector (WFD):从机器人的位置开始搜索并将其限制在可用空间内
- fast frontier detector (FFD):在每次扫描后执行搜索,遵循边界必然会出现在最近扫描区域的直觉
- incremental WFD:将搜索限制在最近扫描的区域
- rapidly-exploring random trees (RRTs):基于快速探索随机树(RRT)的在 2D 占据栅格地图上的边界搜索方法,这些随机树在全局范围内和局部生长以对最近扫描的区域进行采样
- sample-based frontier detector:基于样本的边界检测器算法通过仅存储搜索树的节点来减少先前方法的计算负载
- 由于 3D 地图的存储和分析成本较高,边界识别在 3D 地图中使用较少
无论采用何种方法,在检测完边界后,经常需要聚类操作(如K-means)以防止边界集的高维化
- potential loop closure aera(潜在闭环区域)
- Grabowski 等人观察到:传感器读数重叠的感兴趣区域可能比新边界更具信息性
- 在主动 SLAM 中,通常的做法是:将潜在的闭环区域以及边界包含在目标候选集合中,或者在探索新领域和重新访问已知地点之间切换
还有一些方法允许在机器人附近识别局部目标位置,但是决策仅在局部最优且会诱发错误行为,这些策略在深度强化学习(DRL)中比较典型,因为可以通过网络记忆减轻局部最优问题
4. 阶段二:效用计算
- 效用计算阶段侧重于评估每个可能的目的地,以估计执行到达每个目的地的动作集合的效果
4.1 朴素代价函数
- 最简单的(也是最先广泛使用的)度量指标是朴素几何函数,例如到目标位置的欧氏距离、到达目标位置所需的时间或要访问的预期大小
- 由于这些度量是在欧氏空间或时态空间上计算的,因此无论选择何种地图表示,它们都可以使用
4.2 信息论(information theory,IT)
-
主动 SLAM 中最常用的效用评估方法是利用信息论来量化联合信念状态中的不确定性,其中有不同的度量方法允许这种量化,并且它们都建立在同一个概念上:
-
熵(entropy,可以定义为一个变量的不确定性、随机性或意外性的度量)
- 联合熵的计算在一般情况下是难以解决的,为了克服这个问题,大多数方法采用熵近似,先独立计算两个变量的效用,然后启发式地将它们结合起来
-
交互信息(mutual information,MI)
- 在主动 SLAM 中评估效用最常用的度量指标不是 SLAM 后验的香农熵,而是其期望减少量,并定义为执行动作后实际状态的熵与期望熵的差值,这个效用函数被称为交互信息
-
散度(Kullback-Leibler divergence,KLD)
- 或称为相对熵,也被用作效用函数,KLD 测量 pdf 形式的变化(如 MI )以及其平均值的转换量
4.3 最优试验设计理论 (Theory of Optimal Experimental Design,TOED)
- 该理论试图直接在任务空间中量化不确定性(即,来自感兴趣变量的方差)
4.4 问题的图形结构(略)
5. 阶段三:动作选择与执行
-
一旦每个可能的目的地都有相关的效用值,主动 SLAM 的最后一个阶段涉及选择最佳目的地。这可以表述为一个优化问题,即达到每个可能的目标位置的一组动作
-
在任何情况下,在选择信息最丰富的目的地后,都归结为使用基于抽样的规划方法,如RRT、概率路线图 (PRM) 或它们的渐近最优变体
-
需要注意的是,尽管在离散的候选集合中选择了最优目的地,但到达目的地的执行路径很少代表原问题的最优解;这种次优性是通过将问题解耦为:首先计算和评估一组目标位置,然后计算通往其中一个目标的路径
6. 信念空间规划与连续空间优化(略)
7. 基于深度学习的方法(略)
8. 多机器人主动SLAM(略)
9. 开放性研究问题
- 超出视线范围的预测
- 从主动 SLAM 到主动空间感知
- 鲁棒的在线信念空间规划和主动 SLAM
- 动态和可变形场景下的推理
- 迈向有意义的和自主的停止标准
- 在主动 SLAM 中的可重复性研究
- 实际应用