LSwarm:复杂城市场景下覆盖受限的大集群高效避碰(Swarm-2019)

摘要

在本文中,我们讨论了用于城市环境连续监视的无人机群的避碰问题。我们的方法LSwarm有效地避免了在三维城市环境中与静态障碍物、动态障碍物和其他智能体的碰撞,同时考虑了覆盖约束。LSwarm计算碰撞避免速度,该速度(i)最大化智能体与全局覆盖策略给出的最优路径的一致性,以及(ii)确保每个智能体收集的覆盖数据的足够分辨率。我们的算法是基于ORCA(最优互惠碰撞避免)制定的,并且相对于群体的大小是可扩展的。我们评估了LSwarm在复杂城市模型中对一群四旋翼飞行器的真实模拟中的覆盖性能。在实践中,我们的方法可以在几秒钟内生成全局轨迹,并可以在几毫秒内计算由几十到几百个智能体组成的群体在由几十栋建筑组成的密集城市场景中的碰撞避免速度。

引语

  • 连续监视包括从感兴趣的区域或范围内的所有区域收集感官数据(例如从摄像机),方法是穿过一条针对最大覆盖范围优化的路径,同时考虑静态和动态障碍物。
  • 对于像监控这样的应用,使用一群智能体,并让每个智能体遵循由全局覆盖策略提供的最佳路径,该策略最大化覆盖区域或从环境中收集的信息。本文用“最优覆盖路径”或“全局覆盖路径”来指代这个全局路径。

相关工作

  • 一些现有的群体算法忽略了群体智能体和环境中动态障碍物之间的冲突,而其他算法没有提供可扩展到数百个智能体的解决方案。
  • 当一个智能体遇到大量动态障碍物时,一个避免碰撞的随意机动将再次导致地面上有价值的数据丢失。
  • 此外,收集的数据的分辨率对于确保其有用性很重要,并且是执行防撞机动时要考虑的重要因素。

目的

我们解决了在城市环境中连续监视时,一群四旋翼飞行器的复杂避碰问题。我们对覆盖区域和数据分辨率施加限制,使得四旋翼飞机在偏离以避免碰撞时损失最小的地面覆盖信息

主要贡献

  • 引入LSwarm,这是一种四旋翼飞行器群的局部防撞方法,用于对大型、复杂的三维城市环境进行连续监视。LSwarm建立在ORCA
    (一种基于速度障碍物的碰撞避免方法)的基础上。
  • 它是第一个考虑以下所有因素的实现:
    • (a)与智能体和动态障碍物的碰撞避免,
    • (b)与静态障碍物的碰撞避免,
    • ©对大量智能体的可扩展性,
    • (d)加速度限制(动力学限制),
    • (e)覆盖范围的限制,
    • (f)位置和速度的不确定性。
  • 我们的覆盖约束考虑了以下几点:
    • (一)在避免碰撞期间,每个智能体最大程度地符合由全局覆盖策略给出的最优路径。换句话说,为每个智能体计算的碰撞避免速度也最小化了覆盖区域损失(在第三节A中定义)。
    • (二)智能体传感器获得的覆盖数据具有足够的分辨率(由地面采样距离(GSD)定义)。

实验

  • 我们在四个不同的三维城市场景中对四旋翼飞行器群进行了精确的模拟。根据型号的不同,建筑物的数量在10到80之间变化,建筑物的高度在5到30米之间变化。我们观察到,随着动态障碍物数量的增加,LSwarm在覆盖区域方面比ORCA的使用提供了高达两倍的改进

行文流程

  • 在第二节中,我们首先回顾了之前在覆盖策略和碰撞避免方面的工作。
  • 在第三节中正式定义了我们的覆盖约束,并给出了全局lawn mower策略的描述,
  • 第四节中给出了我们的局部碰撞避免算法。
  • 第五节介绍了我们实现的实验和结果。
  • 第六节总结了该文章,并提出了今后工作的可能方向。

相关工作

基于群体的覆盖优化和冲突避免策略的工作

  • 之前工作偏向于集中式生成路线,集中式反馈
  • 与以前的工作相反,我们的方法结合了全局覆盖策略(基于lawn mowe策略)和局部碰撞避免方案(基于速度障碍的碰撞避免),避免了动态碰撞。
  • 在我们的例子中,全局覆盖策略只考虑了避免静态障碍物,而没有考虑群体中的智能体间冲突。分散的局部碰撞避免公式可以扩大到大量的群智能体,避免了单点故障,并且还考虑了环境的动态特性,例如处理未知的障碍物

基于速度障碍的碰撞避免

  • 速度障碍方法利用观察到的速度来估计障碍物的未来位置。速度障碍(VO) 方法将工作空间中的碰撞避免问题转化为速度空间中的等效公式
  • 相互速度障碍(RVO)改进了速度障碍,以解决机器人与机器人的碰撞避免,其中每个智能体根据其他智能体的速度选择自己的速度
  • 最佳互惠避碰(ORCA)进一步建立在RVO的基础上,为多个机器人提供了避免相互碰撞的充分条件,从而保证了无碰撞导航
  • 最近策略优化(PPO),一种基于策略梯度的强化学习算法,用于分散碰撞避免,使用PPO的智能体的避碰成功率略高,更快达到目标,平均速度也更高。
  • 尽管ORCA具有分散性和可扩展性的优点,并且该算法为每个智能体的位置和速度方面设置了完美的状态信息,但是不包含模型的不确定性

建模的不确定性

  • 已经提出了许多技术,通过考虑智能体定位和附近障碍物感测的不确定性,将基于VO的算法扩展到更实用

  • Hennes等人[30]提供了一种基于自适应蒙特卡罗定位的解决方案(AMCL),用于建模智能体的位置和智能体之间的基本通信,以共享附近智能体的位置和速度。虽然这种方法在地面机器人(二维场景)中效果很好,但AMCL对里程计和激光数据的依赖使其很难用于无人机对无人机。

  • 全球定位系统-实时运动学(GPS-RTK)等传感器技术的最新进展已将智能体的定位精度提高到厘米级。因此,在附近的群体智能体之间传递这样的信息可以产生更好的冲突避免方案。

  • 即使在没有全球定位系统的环境中,像PIXHAWK [31]这样的工作已经表明了基于视觉的定位和使用立体摄像机检测附近障碍物的可行性,所有计算都在车载计算机上进行。此类技术可用于检测和避免不活跃的动态障碍物,如鸟类。

  • 斯内普等人[33],提出了基于卡尔曼滤波的方法,根据位置和速度的不确定性来改变智能体之间的安全距离

  • 我们使用类似的基于卡尔曼滤波的方法来处理智能体和障碍物之间的不确定性*。

  • 模拟环境:OpenUAV,OpenUAV目前的实现能够模拟9个带摄像头的UA V和大约30个不带模拟摄像头的UAV。

  • ORCA不足以在城市场景中避免碰撞,因为它没有适合密集三维城市环境的静态碰撞避免方法。LSwarm克服了ORCA的这种局限性,保留了其可扩展性和与全局规划兼容等优势

城市场景中的群体覆盖

  • 定义了我们对承保范围损失和收集数据的解决方案的约束。
  • 我们陈述了我们为每个群体智能体所做的假设,然后描述了提供最佳覆盖路径的全局lawn mower策略。

覆盖约束定义

LSwarm的覆盖限制使用碰撞避免速度的计算使得覆盖区域损失最小化,并且收集的数据的分辨率令人满意。

覆盖区域损失
  • areapref:完全遵循最佳覆盖路径无损失的覆盖面积
  • areaactual:遇到障碍物进行躲避后实际情况下的覆盖面积
  • areaoverlap:完美和实际的重叠区域面积
  • overlap:重叠区域比例
  • 覆盖区域损失=1-重叠比例

在这里插入图片描述
在这里插入图片描述

传感器分辨率
  • 假设我们群体中的每个四旋翼飞行器或智能体都有一个传感器(在我们的例子中是一个摄像头)来从环境中收集信息。传感器被建模为具有固定顶角的环境的圆锥视图。这个视锥基圆的半径r将取决于四旋翼飞行器飞行的高度h,θ为圆锥顶角的一半
    在这里插入图片描述
  • 我们使用了一种称为地面采样距离(GSD)的测量方法,来进行分辨率的覆盖限制。GSD是地面上的长度,由我们的相机给出的图像上的一个像素来表示。
  • GSD随高度增加而增加,GSD值越大,分辨率越差
  • 它提供了四旋翼飞行器飞行高度和从该高度在地面上的覆盖的区域特征之间的线性关系。
    在这里插入图片描述
  • 由于GSD是针对矩形图像计算的,因此我们在计算GSD时采用传感器圆锥体的基圆内的最大面积正方形。这个正方形的面积被认为是四旋翼飞行器在某一瞬间所覆盖的面积。
  • 矩形图像的GSD通常计算如下:
  • h是飞行高度,K是常数
  • Sensor Height和Sensor Width相机镜头的尺寸
  • f是镜头的焦距
  • s是覆盖最大面积正方形的边
  • 由于我们考虑的是正方形摄像头拍摄,因此GSDh等于GSDw

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

群体智能体的假设

  • 假设附着在智能体上的传感器总是面朝下,与智能体的方向无关。
  • 假设每个智能体都知道自己的位置和速度,并且可以感知周围其他智能体的位置和速度。
  • 所有这些数值都有一定程度的不确定性。第四节。讨论我们的卡尔曼滤波方法来处理这种不确定性。

最佳覆盖路径

  • 我们使用简单的割草机扫描来生成我们的最佳覆盖路径
  • 覆盖建筑物密集建造的遮挡区域是一个挑战,遮挡问题可以通过让智能体调整他们的高度飞越造成这种遮挡的建筑物来缓解。
  • 俯视的城市街区的割草机路标。白色部分代表建筑物(障碍物),黑色区域代表无障碍空间。割草机覆盖的一部分以绿色和红色显示。绿色代表最佳操作高度,而红色代表避开建筑物的升高的高度。

在这里插入图片描述

具有覆盖约束的局部碰撞避免

  • 简要介绍了ORCA,然后定义了带有覆盖约束的本地碰撞避免方法。
  • 速度障碍(VO):考虑一对智能体A和B,该对智能体的速度障碍(VO)定义为A相对于B的所有相对速度的集合,该集合将导致A和B在时间τ之前发生碰撞。它的正式定义是:
    在这里插入图片描述
  • D(p,r)是以p为中心的圆盘,半径r
    在这里插入图片描述
  • ORCA将所有智能体表示为圆盘,圆盘在3-D中扩展为球体表示。以pB-pA为中心。我们可以从VO的公式中推断,对于任何速度vB属于VB,如果vA不属于VOτA|B⊕VB,那么a和b保证至少在时间τ内避免碰撞。ORCA算法计算最佳避碰速度集,从中可以选择新的Va和VB
  • 优化速度计算:ORCA在最接近vopt A-voptb的VOτA | b的边界上找到相对速度。
  • u是从vopt A到vopt B到VO边界点的向量
  • 避免碰撞导致的偏差,A可能会碰撞到建筑物。所以我们只考虑最近的点作为障碍。

在这里插入图片描述

模型的不确定性

  • 通过卡尔曼滤波处理群体智能体和障碍物的位置和速度中的噪声,克服了ORCA对完美感知的要求。
  • 我们使用卡尔曼滤波器来估计所有运动实体的位置和速度的均值和协方差矩阵。然后,我们使用实体协方差矩阵最大特征值的平方根作为度量来增加该实体的边界球半径。因此,随着感知不确定性的增加,每个智能体都采取更保守的方法来避免冲突。

覆盖约束下的动态避碰

在这里插入图片描述
当前一个单位时间内的的覆盖面积
在这里插入图片描述
改变速度以后一个单位时间内覆盖面积
在这里插入图片描述
s的变化
在这里插入图片描述
最大化重复率,就是要让新覆盖的面积最大化重复最佳覆盖面积。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值