区域卫生信息平台基本交互规范_特刊：多机器人（MRS）与多智能体（MAS）系统

本期为 Springer 旗下 Autonomous Robots 期刊 2020年3、4月特刊，主题为多机器人（Multi Robot System）与多智能体系统（Multi Agent System）。由于内容过长，拆分为三篇文章来写。本文为第三部分，重点为人机交互和系统任务。

https://link.springer.com/journal/10514/volumes-and-issues/44-3link.springer.com

往期文章链接：

燃雪：特刊：多机器人（MRS）与多智能体（MAS）系统_Part 1 通信、估计、定位与数据融合zhuanlan.zhihu.com

燃雪：特刊：多机器人（MRS）与多智能体（MAS）系统_Part 2 路径规划、决策与控制zhuanlan.zhihu.com

燃雪：特刊：分布式多机器人系统（DMRS）分析与实验zhuanlan.zhihu.com

燃雪：特刊：人机协作学习zhuanlan.zhihu.com

人机交互

基于高层时序逻辑的机器人群分布式控制器的自动整合

Automated synthesis of decentralized controllers for robot swarms from high-level temporal logic specifications

人类与多机器人系统的交互：一种基于自然情感的方法

Humans interacting with multi-robot systems: a natural affect-based approach

操作员干预的有效调度：协同排队策略

Cooperative Queuing Policies for Effective Scheduling of Operator Intervention

系统任务

无位置信息的移动传感器网络分布式覆盖

Distributed coverage in mobile sensor networks without location information

CARE：未知环境完全覆盖任务中机器人故障情况下多机器人自主合作复原与效率

CARE: Cooperative Autonomy for Resilience and Efficiency of robot teams for complete coverage of unknown environments under robot failures

基于PHD滤波器的分布式多目标搜索与跟踪

Distributed multi-target search and tracking using the PHD filter

具有静态和移动警卫混合团队的自适应目标跟踪：部署和激活策略

Adaptive target tracking with a mixed team of static and mobile guards: deployment and activation strategies

可遍历环境的空地协同建图

Air-ground cooperative topometric mapping of traversable ground

Paper 14：Automated synthesis of decentralized controllers for robot swarms from high-level temporal logic specifications

群体机器人技术领域的大部分工作集中于针对产生突发群体行为的单个机器人的自下而上的局部规则设计。在本文中，我们采用自上而下的方法并考虑以下问题：我们如何指定所需的集体行为，并自动生成可分布在机器人上的分布式控制器，以可证明正确的方式实现集体目标？我们提出了一种形式化的规范语言来描述群体和个体两个层次上的群体行为。我们提出了分布式控制器和同步框架（synchronization skeletons）的自动综合算法描述了机器人群体必须如何协调才能满足规范。通过仿真示例演示了本文提出的方法。

区域转变可能性；一个可行的匹配方式；一个不可行的匹配方式

群体机器人技术是对机器人系统的研究，该机器人系统由大量机器人组成，这些机器人彼此之间以及与周围环境的局部交互导致集体的智能行为。群机器人系统具有许多潜在的应用场景，例如勘探、监视、搜索和救援、入侵检测和清理任务等。群体机器人技术一直是非常活跃的研究领域。但是，人类设计者的直觉仍然是群机器人系统开发的主要要素，基于迭代设计和测试的反复试验过程是许多现有设计方法的重要组成部分。

技术的进步使得能够大量生产廉价且功能强大的机器人，并且对于复杂任务进行规范和自动化的设计需求将不可或缺，这些技术和方法会导致群体机器人系统具有可证明正确的集体行为。为此，在本文中，我们从分布式控制器的高级时间逻辑规范出发，考虑了用于机器人群安全导航的自动综合问题。所提出的框架促进了群体机器人系统的设计和部署过程，同时为实现集体目标提供了正式保证。

我们区分了多机器人系统（multi robot systems）和群体机器人（robotic swarm）：前者的机器人的数量已知并且每个机器人被视作独立个体，后者是一群可替换的机器人的群体，机器人的数量可能很大，甚至是先验未知的。本文提出了一种基于线性时态逻辑(Linear Temporal Logic, LTL)的形式化规范语言，用于在独立于群体中机器人数量的抽象系统上制定不同的导航语义。通过定义由用户指定的全局规范语言，本文提供算法来自动合成离散且分布式的控制器，这些控制器可以分配给一组机器人，使swarm系统满足给定的指令。为此，我们为整个swarm综合了一个集中式控制器，然后将控制器分配到不同的区域以获得局部控制律。

三组机器人通过走廊，在实验室、办公室和机房之间导航

合成的本地程序可以异步（asynchronously）执行，但是，为了实现所有目标，可能需要机器人进行同步。例如，如果要求整个群必须同时在一个区域中，则需要一种协调机制来向机器人发出信号，以确定整个群体当前是否在特定区域中。通过向分布式控制器添加有关协调或同步信息（例如，机器人何时必须与其他机器人同步以及他们必须与哪个机器人同步），我们确保本地程序的异步和分散执行符合规范。

每个合成的本地程序将由一组数量可变的机器人执行。我们假设每个组在区域之间（几乎）一起移动，例如，如果一组机器人从区域A移到区域B，并且该组中的某些成员已经到达B，则他们在执行其下一步任务之前会等待其他组成员进入B。由于成组移动的物理特性，在处理安全性约束时必须格外注意，例如，如果规定禁止机器人群体同时位于区域A和B中，则离散控制器不能在区域转化的过程中保证群体的过渡状态。因此，在实际应用中，我们将看到这种机器人swarm群同时存在于两个区域的中间状态，这需要提出的综合控制器和协调机制必须能够包含这些状态。

本文基于Moarref & Kress-Gazit, 2017工作进行扩展，包含对方法和结果的详细说明。另外，本文描述了由于无法对机器人编号而导致规范无法实现的情况，为集中式控制器的定量分析提供了一种新的算法，以决定其是否可行。集中式控制器可以由有限数量的机器人执行，如果是这样，则计算以分散方式执行计划所需的最少机器人数量。

https://link.springer.com/article/10.1007/s10514-019-09861-4link.springer.com

Moarref, S., Kress-Gazit, H. Automated synthesis of decentralized controllers for robot swarms from high-level temporal logic specifications. Auton Robot 44,585–600 (2020)

Paper 15： Humans interacting with multi-robot systems: a natural affect-based approach

本文提出了一种新颖的人机多机器人系统交互方法，该方法具有两个主要功能：自然交互和基于行为的机器人行为适应。具体地，所提出的系统使得能够借助腕戴式设备（例如商用智能手表）进行交互，该设备允许跟踪用户的运动和心脏活动。因此，一方面，该系统允许用户通过建立腕关节运动和机器人速度之间的自然映射来直观地驱动机器人。另一方面，该系统通过分析心率变异性来估计用户在交互过程中的精神疲劳程度。该交互系统适应了多机器人系统在交互和控制任务使交互用户精疲力尽时的行为，并进行了简化。实验验证了该系统的有效性。首先，将自然交互和基于影响的交互分开考虑。然后，针对一个复杂的真实场景对该方法进行了测试，并在虚拟现实中进行仿真，以获得身临其境、真实的交互体验。实验验证结果清楚地表明，所提出的基于情感的自适应系统可以减轻用户的疲劳和心理负荷。

提出的系统框架：智能手表实现基于用户前臂运动的自然界面，与多机器人系统进行基于情感的交互

嵌入式计算，传感，通信系统和网络技术方面的最新技术发展正导致对多机器人系统的兴趣不断增加。实际上，利用群体机器人的功能可以解决一些复杂的问题，利用有限尺寸的设备可以实现较复杂的计算，通信和传感功能。当前的大多数多机器人系统应用都可以在工业领域找到，它们主要用于物流和自动化货物运输或在农业领域(土壤整备，农药施用和收获)。但是，考虑到小型移动机器人平台（地面，空中，水下等）的日益普及，在不久的将来，多机器人系统可能会在家庭应用中变得越来越流行。

迄今为止，在多机器人系统领域的大多数研究都致力于最大程度地设计适当的控制方法，以使机器人实现一些共同的目标。但是，这些方法通常考虑完全自治的多机器人系统，该系统能够实现基本和简单的协作行为，例如聚合，同步，覆盖或编队控制。因此，通常，在传统方法中是不考虑人类操作者的存在影响的。

本文的主要动机是更改此方法，明确考虑了人类操作员与多机器人系统交互的可能性，目的是大大提高整个系统的功能。实际上，由人与多机器人系统进行交互可以充分利用操作员的灵活性和技能，包括高级推理，处理意外情况并加以解决的能力以及适应新目标的能力。相关的应用场景包括，在恶劣和动态环境中的搜索和救援操作（通常是非结构化和不可预测的），或生产工厂中的货物运输（人工操作人员的存在使系统高度动态且难以预测）。但是，在最近的文献中，很少有人提出考虑让操作员与多机器人系统交互的可能性。

作为一个缺点，值得一提的是，就认知负担而言，与多个机器人构成的这种复杂系统的交互对于操作员而言可能是相当苛刻的。在监督系统、向正确的机器人提供正确的输入并解释来自现场的反馈的同时，需要付出很大的努力来实现和保持适当的态势感知。此外，这种复杂性随着机器人数量的增加而增加，在远程交互中变得至关重要。因此，如果考虑用户与多机器人系统的交互，从认知需求的角度来看，不仅关注交互的有效性，而且最重要的是关注操作人员的易用性和交互任务的可持续性，这是最基本的。

因此，在本文中，我们提出了一种用于多机器人系统的新颖交互方法，该方法可以使人类直观地与机器人交互，从而模仿现实世界的行为。为了达到这个目的，它利用用户前臂的运动和手势，并在机器人的速度指令中建立一个前臂运动的地图。绘制地图的方式是这样选择的，为了让机器人完成任务，用户必须执行与现实世界中的日常操作相对应的动作(例如，旋转手腕来转动机器人)。这使交互过程变得自然而直观。此外，系统考虑用户的脑力劳动消耗，并相应地改变其行为，从而在超过使用者执行能力时简化交互任务。这是通过使用情感机器人监测用户的心率变异性(heart rate variability, HRV)来实现的。这是第一个自然交互系统的例子，考虑到操作员的精神压力，调节其与一组机器人的交互。

在本文中，我们进一步扩展了这种方法。特别地，我们提出了一种基于HRV分析的精神疲劳检测算法，并在便携式日常心率监测设备上进行了验证。此外，我们扩展实验验证该基于行为的交互方法，考虑一个复杂的应用场景，在这个场景中，大量的机器人监控一个广泛的区域，而人类操作员必须监督整个团队，并根据机器人的通知(或请求)要求采取行动。在此背景下，我们证明了所提出的基于行为的交互系统对用户有积极的影响。事实上，它减少了精神负担和疲劳，尽管它可能导致系统性能下降，因为适应可能需要减少功能或额外的限制。

用于选择操作模式的状态机

用于测试基于手势交互的人-多机器人系统交互算法的VR场景

https://link.springer.com/article/10.1007/s10514-019-09889-6#ref-CR50link.springer.com

Villani, V., Capelli, B., Secchi, C.et al. Humans interacting with multi-robot systems: a natural affect-based approach. Auton Robot 44,601–616 (2020)

Paper 16：Cooperative Queuing Policies for Effective Scheduling of Operator Intervention

我们考虑了多机器人系统应用，其中一组机器人可以请求人类操作员干预以处理困难的情况。随着请求数量的增加，团队成员将不得不等待直到操作员注意到，因此操作员将成为系统的瓶颈。在这种情况下，我们的目标是通过将操作员建模为共享资源，使机器人学习协作策略以减少系统的等待时间。特别是，我们考虑了一个排队队列模型，其中机器人可以自己决定是否加入队列并使用多机器人学习来估计最佳合作策略。更详细地说，我们将问题形式化为分布式马尔可夫决策过程，并提供合适的状态表示形式，以便应用在独立的学习方法中。

水面监控模拟工具

在许多多机器人场景中，例如环境监控或搜索与救援，需要一个或几个操作员与一组机器人互动才能执行挑战性环境中的复杂任务。机器人，特别是在现场的机器人，经常会遇到意想不到的事件，如果没有操作员的干预，就无法进行管理。例如，在环境监视应用程序中，机器人可能面临极端的环境事件（例如，水流）或移动障碍（例如，动物接近机器人）。在这种情况下，操作员通常需要中断单个团队成员的活动以应对特定情况。

在这些情况下，操作员的监视和监督角色至关重要，尤其是在团队规模变大时。为了减少操作员的监视任务并给他/她更多的时间专注于需要注意的机器人，有几种方法考虑了自反射的概念，机器人可以识别其潜在问题并通过发送请求来请求操作员干预。但是，大型团队很容易发送多个请求导致操作员不知所措，从而阻碍了团队的效率。因此，团队成员必须等到操作员注意到他，这使得操作员成为系统的瓶颈。排队（queuing）是管理和解决此问题的自然方法。先前的研究尝试通过考虑各种队列规则（例如，先进先出（First in First Out , FIFO）和最短作业优先（Shortest Job First, SJF））来提高系统的性能（即，减少机器人等待操作员的时间）或对此类请求进行优先排序。在这两种情况下，队列大小都可能无限增长，因为没有机器人会在引起操作员注意之前离开队列。

为了解决这个问题，我们专注于阻塞队列模型(balking queue model)，在该模型中，用户/代理（即请求关注的机器人）可以决定加入队列还是不加入队列。此类决策通常基于一个阈值，该阈值是通过为每个代理分配用于接收服务的一般奖励以及在队列中等待的成本来计算的。当将此模型应用于机器人应用程序时，没有明确指示如何计算此类阈值。更重要的是，该模型没有考虑退出的成本（即，在没有人工干预的情况下，试图克服困难的情况，机器人可能遭受的潜在故障的成本）。

考虑到这一点，我们的重点是设计一种方法，使机器人团队可以学习协作禁止策略以更好地利用共享队列。因此，我们将上述问题设计为分布式马尔可夫决策过程（Decentralized-MDP），其中机器人团队必须合作以优化团队空闲时间。由于部分可观察性和有限的沟通，通常很难找到最佳的分散策略。因此，我们的目标是通过将队列的状态作为附加功能添加到机器人的本地状态来提供可伸展的状态表示，并使用多个独立的学习者解决潜在的Dec-MDP问题。我们说明，此附加功能将提高我们的主要评估指标（即团队闲置时间）。

更详细地讲，本文对现有技术进行了以下贡献：（i）我们将人类操作员建模为机器人可以使用阻塞队列访问的共享资源；机器人确定他们的需求，并决定是否加入队列（因此等待访问资源）。（ii）将问题正式化为Dec-MDP，并提供易于处理的状态表示形式，以了解每个机器人的退出策略。（iii）最后，我们通过将团队的闲置时间与最新的队列规则进行比较来评估模型的性能。总的来说，实验结果表明，与其他学习模型相比，使用我们的模型减少了总空闲时间达68%(没有balking)，并增加了56%的团队奖励。

团队在学习阶段的每个时期都积累了奖励

比较了各种模型的总空闲等待时间

https://link.springer.com/article/10.1007/s10514-019-09877-wlink.springer.com

Raeissi, M.M., Farinelli, A. Cooperative Queuing Policies for Effective Scheduling of Operator Intervention. Auton Robot 44,617–626 (2020)

Paper 17: Distributed coverage in mobile sensor networks without location information

随着机器人技术的最新发展，现在可以使用移动传感器进行现场覆盖，因此一小部分传感器可以安装在移动机器人上并移动到所需区域。与静态设置相比，由于传感器连续运动而产生的动态变化，在移动传感器网络中区域覆盖更为复杂。在更现实的情况下，甚至很少或没有关于传感器场的现有度量信息，这种复杂性甚至更高。在本文中，我们考虑了一组移动传感器的自部署问题，这些传感器不知道面积，节点数，它们的位置，甚至彼此之间的距离。在此受限设置中，我们将问题表述为一个多人游戏，其中每个传感器都在考虑相邻传感器重叠的感应区域的同时，试图最大化其覆盖范围。我们提出了一种分布式学习算法，用于协调传感器在野外的运动，并证明其收敛于公式化游戏的均衡性。仿真结果表明，对于中等密度的部署，所提出的算法可与现有的位置相关的移动性策略不相上下，而性能优于无位置算法。

传感器网络与网络的抽象表示

移动传感器网络（Mobile sensor networks, MSN）由传感器节点组成，这些传感器节点可以自行移动并与物理环境进行交互。这样的网络可以在危险物质的监视，目标跟踪，搜索和救援以及实时监视的范围内实现多种应用。MSN性能的关键是有效的传感器移动性策略，该策略能够协调移动传感器的运动，以实现具有理想监视质量的区域覆盖。近年来，在MSN的背景下，已提出了许多用于区域覆盖的传感器移动性策略。这些策略可以分为两大类: 基于位置的策略和不依赖位置的策略。

基于位置的策略在实时计算方面，需要的定位设备或定位计算成本较高。网络拓扑由于节点移动而动态变化，这导致频繁地重新执行定位过程，增加了传感器处理负荷与通讯开销。另外GPS等方案也受限于使用环境。因此有必要开发无位置定位信息即可执行覆盖的分布式算法。

在本文中，我们设计了传感器节点部署和区域覆盖的无位置的移动策略。我们考虑一种设置，其中传感器不能获取有关面积，节点数，它们的位置甚至彼此之间的距离的信息。据我们所知，这些受限假设的问题尚未得到研究，我们旨在通过以下贡献填补这一空白：

在节点不知道其位置的情况下，我们利用最近的一种技术，用单纯复形（代数拓扑领域的数学对象）来建立网络复盖拓扑的无坐标抽象表示。该表示准确地捕获了传感器之间重叠区域的信息，并且可以通过简单的本地计算获得，而无需进行定位过程。该方法能够准确地获取传感器间重叠区域的信息，无需进行定位，只需进行简单的局部计算即可获得重叠区域的信息。
通过上述表示，每个移动传感器都具有其邻域的一个抽象局部视图。由于我们对节点的自动自部署感兴趣，我们将这个问题视为非合作博弈，因为它是在有限信息假设下建模协调问题的成熟工具。特别地，我们提出了一个公式的覆盖问题作为一个精确的潜在对策，在这种方法中，每个传感器都试图通过保持与相邻传感器的重叠区域尽可能小来最大化其可实现的覆盖范围。潜在对策是一类具有良好性质的非合作对策的子类，它能使均衡点上的全局性能得到增强。
在使用潜在博弈时，一个重要的问题是设计分布式学习算法，利用局部信息和处理能力，以达到博弈的纳什均衡(NE)。各种分散学习规则被提出用于潜在博弈的最优行动选择。这些算法主要根据其收敛到平衡的信息要求而变化。本文提出的无位置移动传感器部署(location-free mobile sensor deployment, LFMSD)算法是对此前摄像机传感器网络学习过程的改进。在我们的LFMSD算法中，每个传感器只记住它所执行的动作，以及在最后两次执行过程中所获得的效用值。此外，每个节点的1-simplices和2-simplices的数量被用作一个度量来确定节点应该移动的距离。这样，节点执行一个非常轻量级的过程来了解它们高覆盖率的位置。
而LFMSD使用类似的行为更新法律，我们注意到，现有的收敛性分析与Zhu & Martinez, 2013 工作有很大的联系，但并不能直接应用到我们的情况。因此，我们工作的另一个贡献是关于部署学习算法的严格收敛分析和推导收敛到NE的新条件。
我们进行了广泛的仿真实验，以评估提出的算法，并将其性能与现有方案进行比较。

传感器网络初始位置与3000次迭代后的最终位置

本文LFMSD方法与此前的PF方法对比

https://link.springer.com/article/10.1007/s10514-019-09859-ylink.springer.com

Varposhti, M., Hakami, V. & Dehghan, M. Distributed coverage in mobile sensor networks without location information.Auton Robot 44,627–645 (2020)

Paper 18: CARE: Cooperative Autonomy for Resilience and Efficiency of robot teams for complete coverage of unknown environments under robot failures

本文针对存在机器人故障的情况，解决了多机器人在复杂环境中区域覆盖路径规划问题。意外的机器人故障可能会严重降低机器人团队的性能，并在极端情况下危及整体的任务执行。因此，本文提出了一种分布式算法，称为“具有弹性与效率的协同自主方法”（Cooperative Autonomy for Resilience and Efficiency, CARE），该算法不仅可以为机器人团队提供针对单个机器人故障的弹性，还可以通过事件驱动的重新规划来提高整体操作效率。该算法使用分布式离散事件监督程序，当机器人发生故障或空转时，它会触发一组可行玩家之间的博弈，从而为任务分配做出协作决策。博弈理论结构是使用潜在博弈（Potential Games）建立的，其中每个玩家的代价函数与所有玩家的共享目标函数保持一致。该算法已在高精度机器人模拟环境上的各种复杂场景中得到验证，结果表明，与三种其他方法相比，该团队可在故障情况下实现完全覆盖，减少覆盖时间并更快地发现目标。

团队弹性和团队效率示意图

自主机器人的搜索和覆盖操作具有广泛的应用，例如地板清洁，割草，原油泄漏清洁，农作物切割和播种，地雷探测，海底检查。这些操作需要覆盖路径规划（Coverage Path Planning, CPP），机器人需要一个覆盖路径，使其能够完全覆盖搜索区域，同时避开障碍物，使重叠轨迹最小，使总覆盖时间最小。

尽管使用单个机器人时有许多CPP方法可用，但只有有限的工作集中在多机器人覆盖路径规划（MCPP）上。现有MCPP方法中一种流行的控制结构是将整个工作负载划分为多个任务，然后对每个任务使用某种单机器人CPP方法进行覆盖。

但是，由于机器人通常在不确定的环境中运行，因此容易出现各种故障，例如传感器或执行器故障，机械缺陷，动力损失。这些失败的后果包括覆盖范围不足，关键数据丢失，性能下降（例如，未检测到目标），操作时间延长，以及在极端情况下总体任务失败。例如，雷区覆盖搜索行动中的覆盖缺口可能会留下未被发现的水下地雷，这对横穿船只构成了严重威胁。因此，至关重要的是，即使在少数机器人出现故障的情况下，机器人团队也可以维持团队的整体运作并保护任务目标（例如，完全覆盖），这可以使机器人团队具有应对失败的能力。复原力的作用是确保系统级的生存能力，并能从意外的紧急情况（例如，机器人故障）中快速恢复到正常状态。在MCPP问题的情况下，弹性的机器人团队有望以最佳方式自主地重新组织活动的机器人，以完成故障机器人的未完成任务。

其次，机器人团队的高效运作也很重要。通常，由于错误，不完整或缺乏先验环境知识，初始任务分配可能不是最佳的。结果，某些机器人可能会更早完成任务并变得空闲，这浪费了他们的资源。因此，至关重要的是，机器人团队以最佳方式自主地重新分配这些空转机器人，以帮助其他机器人减少总覆盖时间。

挑战：

可扩展性：MCPP算法应具有可扩展性，以适应越来越多的任务和/或机器人，从而使分布式控制结构变得合适。
优化因素任务重新分配的优化必须考虑以下因素：
1）任务价值，可以通过任务中未发现目标的预期数量（例如，要砍伐的农作物或要发现的矿山）来量化。2）现有机器人成功完成有争议的任务的概率取决于各种因素，包括其当前的能量水平，前往有争议的任务的成本以及完成这些任务的成本。
动态变化的条件机器人的条件以及任务在覆盖期间会动态变化。随着目标的发现，任务价值下降。另一方面，机器人在探索过程中会耗尽电池电量，从而降低了成功的可能性。因此，优化过程必须适应这些动态因素。
计算时间首先，优化必须是事件驱动的，即仅在失败和/或空转的情况下才触发。其次，一旦触发了优化，就必须及时做出任务重新分配决策，以避免延长覆盖时间，从而仅对可用机器人和任务的一部分进行局部分布式，以事件为中心的优化。
局部目标与全局目标之间的联系尽管局部优化决策对于整个团队而言可能不是最佳选择，但重要的是，它仍应与团队的全局目标保持一致。换句话说，局部优化不仅必须使所涉及的机器人受益，而且还应使整个团队受益。目标包括及早发现剩余目标，减少总覆盖时间以及完全覆盖。
完全覆盖：MCPP算法必须保证先验未知环境的完全覆盖。

多机器人覆盖任务示意图

据我们所知，在现有的MCPP方法中，弹性覆盖的概念尚未得到充分解决。因此，我们提出了一种新颖的在线MCPP算法，用于在先验未知环境中进行有效而有弹性的覆盖，从而解决了上述挑战。该算法称为弹性和效率合作自治（CARE）。对于每个任务的覆盖率控制，CARE使用我们先前发布的算法，这是一种单机器人在线CPP算法。

CARE算法以分布式但合作的方式运行。每个机器人都使用离散事件监控器（DES）进行控制，该事件监控器在机器人出现故障或空转时触发一组可行玩家之间的博弈，从而为任务重新分配做出协作决策。使用潜在博弈建模，每个玩家的效用与所有玩家的共同目标函数相联系。在无故障的情况下，CARE重新分配空转机器人以支持其他机器人执行任务；因此减少了覆盖时间并提高了团队效率。万一机器人发生故障，CARE可以通过优化其他机器人的分配来填补覆盖范围，从而确保完全覆盖。因此提供了弹性，尽管覆盖时间可能会有所减少。

CARE算法已经在各种复杂的，充满障碍的复杂场景中的得到了验证。结果表明，与三种替代方法相比，该团队可以完全覆盖故障，并能够更快地发现目标。

使用CARE进行有效覆盖

在各种不同噪声水平场景下的覆盖率

https://link.springer.com/article/10.1007/s10514-019-09870-3link.springer.com

Song, J., Gupta, S. CARE: Cooperative Autonomy for Resilience and Efficiency of robot teams for complete coverage of unknown environments under robot failures. Auton Robot 44,647–671 (2020)

Paper 19: Distributed multi-target search and tracking using the PHD filter

本文提出了一种分布式估计和控制算法，该算法使一组移动机器人能够搜索和跟踪未知数量的目标。这些目标可能是固定的也可能是移动的，随着目标进入和离开目标区域，目标的数量可能会随时间变化。机器人配备的传感器具有有限的视野，并且可能会遇到假阴性和假阳性检测。机器人使用概率假设密度（Probability Hypothesis Density, PHD）滤波器设计了新颖的分布式方法（考虑了传感器的局限性）来估计目标的数量和目标的位置。然后，机器人使用劳埃德（Lloyd）算法（已证明对覆盖和搜索任务有效）的分布式控制算法在环境中驱动其运动。我们将PHD滤波器的输出用作劳埃德算法中的加权函数。这会使机器人被拉向可能包含目标的区域。我们通过一系列广泛的模拟实验证明了我们提出的算法的功效，包括与具有统一重要性加权函数的基于覆盖率的控制器进行比较。

六个机器人场景下Lloyd算法Voronoi单元划分

目标搜索和跟踪是机器人技术中的一项规范任务，涉及诸如地图绘制，监视以及搜索和救援等问题。在任何这种情况下，机器人团队的任务都是探索一个感兴趣的区域，以便定位和跟踪多个目标。这些目标可以是固定的也可以是移动的。目标的数量通常是未知的，并且随着目标进入或离开目标区域而可能随时间变化。能够跟踪目标的数量和目标位置要求机器人具有：（1）能够执行此任务的估计算法，以及（2）驱动机器人进行探索以检测新目标以及跟踪先前检测到的目标。这两个问题在文献中已被大量研究。

概率搜索方法最适合目标跟踪问题，因为机器人的传感器中存在很大的噪声。多目标跟踪特别困难，因为机器人还必须解决数据关联问题（即，将测量值与目标匹配）并考虑错误肯定或错误否定检测的可能性。许多概率性的多目标跟踪方法，包括多重假设跟踪器（Multiple Hypothesis Tracker, MHT），联合概率数据协同（Joint Probabilistic Data Association, JPDA）和概率假设密度PHD。所有这些方法同时解决了数据关联和跟踪问题。我们选择使用PHD滤波器作为目标的表示形式，作为目标状态空间上的目标密度函数，与基于Voronoi的控制算法进行匹配结合。

主动检测和跟踪多个移动目标需要有效地使用多个机器人。解决此问题的方法有很多，一种方法是来自Parker, 2002的多目标协作式多机器人观察（Cooperative Multi-robot Observation of Multiple Moving Targets, CMOMMT），其中一组机器人试图同时观察所有目标。如果无法做到这一点，团队将尽量减少不观察任何单个目标的时间。另一种方法是使用信息理论目标为一组机器人选择动作，以减少目标位置的不确定性。但是，这两种方法都是集中式的，无法在规模较小的机器人团队之上扩展。Hollinger, 2015提出了一种分布式的扩展方法，其中机器人没有可靠的通信，但是他们只考虑跟踪单个目标。

基于Voronoi的控制是用于分布式覆盖和目标跟踪的最成功算法之一。基本思想是使用Voronoi分区划分搜索区域，然后让每个机器人朝其Voronoi单元的质心移动，这一过程称为劳埃德算法。Pimenta, 2008将该想法扩展到异构机器人团队。Arslan & Koditschek, 2016允许具有非完整约束或更高阶动力学的机器人。Bhattacharya, 2014使劳埃德算法可用于探索非凸和非欧几里得环境。但是所有这些工作中的密度函数均与任何特定的目标跟踪方法无关。

基于Voronoi的覆盖技术在目标跟踪问题上的特定应用往往集中在追击者逃避游戏上。考虑了多购买者-单逃逸（multiple-pursuers, single-evasion）问题，并制定了分布式算法来保证捕获。Pan, 2012考虑了对此问题的有趣修改，其中一些追随者充当警卫（guard），以防止逃避者离开环境。Pierson and Rus, 2017考虑了非凸面环境的更现实场景，即追随者必须避免与静态障碍物发生碰撞。他们通过引入可确保安全的障碍识别Voronoi来做到这一点。

我们的方法与那些解决多个机器人跟踪多个目标的问题的工作最为相似。Pierson, 2017提出了一种分布式策略，以确保在2D和3D环境中使用多个追踪器捕获多个逃避者。追踪者被分配给逃避者，并遵循逃避者Voronoi单元区域的梯度。被俘虏后，追击者被重新分配到另一个逃避者。Pimenta等, 2009提出了一种同时覆盖和跟踪（Simultaneous Coverage and Tracking, SCAT）的分散方法。使用劳埃德（Lloyd）算法的连续时间变化来创建控制律，并保证指数收敛到目标函数的局部最小值。决定环境各部分相对重要性的重要性加权函数是一个常数项的线性组合，以鼓励覆盖，而径向基函数以每个目标位置为中心以鼓励跟踪。但是没有讨论如何知道目标位置。

20个机器人和9个静态目标（左）；20个机器人与20个静态目标（右）

在本文中，我们同时考虑了检测和跟踪任务。主要的贡献在于，我们使用PHD滤波器的分布式方法直接解决了多目标估计问题，并使用来自机器人的噪声测量来检测和跟踪目标。提出的分布式PHD过滤器仅要求每个机器人将PHD维持在局部附近，但仍然可以得出与集中式解决方案相同的估算值。这大大减少了每个机器人的内存和计算需求，并提高了解决方案的可伸缩性。然后，我们将PHD用作劳埃德算法（一种新组合）中的重要性加权函数。这自然有效地驱动机器人遵循先前检测到的目标并探索可能包含新目标的未知区域。我们通过一系列针对静态和动态目标的模拟实验证明了这种方法的有效性。我们添加了背景资料，并对以前的结果（包括计算时间）进行了更详细的分析。最大的贡献是一组全新的实验，将以前的2D场景扩展到3D场景，其中一组多旋翼无人机跟踪在地面上移动的目标的集合。这些实验证明了所提出的分布式估计和控制算法在各种设置下都具有灵活性，包括传感器的姿态存在一些不确定性。

平均运行时间与机器人和目标数量的关系

https://link.springer.com/article/10.1007/s10514-019-09840-9link.springer.com

Dames, P. Distributed multi-target search and tracking using the PHD filter. Auton Robot 44, 673–689 (2020)

Paper 20: Adaptive target tracking with a mixed team of static and mobile guards: deployment and activation strategies

这项工作探索了一个画廊问题（Art Gallery）的变体，即再一个多边形画廊中，需要多少个摄像头才能完全覆盖，其中静态和移动的guard以未知的最大速度跟踪移动入侵者。我们考虑特殊情况，即移动警卫只能沿着多边形环境的对角线移动。首先，我们提出一种算法来识别候选顶点在可以放置静态防护罩的多边形中，或者它们可以用作移动防护罩在其上移动的线段的端点。接下来，我们提出一种基于环境三角剖分的环境分区技术，并为每个分区分配防护以跟踪入侵者。分配策略根据移动警卫的任务和协调要求对它们进行分类。最后，我们提出了一种基于入侵者的速度来激活/停用静态警卫的策略。仿真结果表明了所提出技术的有效性。

Art Gallery问题：g1和g2跟踪目标I，而g3静止不动（左）；g3激活，跟踪g1和g2（右）

在过去的二十年中，已经广泛部署了多机器人系统作为传感器平台，以在军事和民用中获得环境状态感知。在这种情况下部署的机器人能够以最少的人工干预自动做出决定并采取行动。有关影响此类机器人系统性能的外源过程的先前信息是其决策过程的重要组成部分。但是，实际上，系统通常不完全了解环境中的不确定性，尤其是在涉及对手时。由于应用程序的敏感性，系统设计人员要么使用贝叶斯方法来最大化期望的回报，要么使用博弈论方法来保证在这种情况下的最小回报。在这项工作中，我们探索了一个不同的方向，即一种自适应方法来应对由于信息不完整而引起的挑战。具体来说，我们考虑使用一组静态和移动传感器在最大速度未知的环境中跟踪移动入侵者的问题。

在一个简单的多边形环境中跟踪一个非常快的入侵者需要⌊n/3⌋个静态守卫覆盖这个多边形，其中n表示多边形的边数。在低入侵者速度下，Laguna, 2016提出了一种基于移动覆盖的跟踪策略，只需要⌊n/4⌋个静态守卫。我们当前的工作概括了上述结果，并提出了一种以任意速度跟踪入侵者的策略，而始终没有覆盖整个环境。我们利用静态和移动守卫，利用覆盖范围的结果为静态和移动传感器的混合团队开发部署和激活策略，以跟踪移动入侵者。部署策略可确保在面对入侵者最大速度的不确定性（准确地说是缺乏知识）的情况下跟踪性能的鲁棒性。但是，传感器的激活策略使其能够适应入侵者的瞬时速度，从而确保跟踪而不会始终覆盖环境。

这项工作的贡献如下：（1）据我们所知，这是第一项解决对入侵者进行持续跟踪的问题，而无需事先知道其最大速度。（2）我们提出了一种自适应的跟踪策略，即它考虑了入侵者激活传感器的瞬时速度。尽管在传感器网络和控制方面有许多工作解决了受控感测的问题，但这是在目标跟踪的背景下解决受控感测的第一项工作。（3）寻找追踪入侵者所需的最少传感器数量的问题是NP难题。就我们所知，这是第一项工作，它提供了足够的数量来跟踪环境中的入侵者所需的传感器的结果，而不会轻易覆盖它，使得守卫数量少于⌊n/3⌋。

一个简单的多边形进行三角形剖分

每个静态守卫可被触发的激活r值

https://link.springer.com/article/10.1007/s10514-019-09833-8link.springer.com

Laguna, G.J., Bhattacharya, S. Adaptive target tracking with a mixed team of static and mobile guards: deployment and activation strategies. Auton Robot 44, 691–703 (2020)

Paper 21: Air-ground cooperative topometric mapping of traversable ground

本文提出了一种在结构化室外和室内环境中从空中和地面视图对可遍历（traversable ground）进行协同环境建模的方法。该方法实现了基于可遍历地面骨架化和图匹配的混合地图构建。得到的地图是一个增强的地面遍历性地图，表示为来自异构源的混合拓扑/度量图。该方法为地面导航和规划提供了一种非常合适的表示方法。为了验证这种方法，在仿真和现实环境中，用无人机在空中制定鸟瞰图，地面机器人在陆地测绘地面地图。

原始航拍图像；可遍历二进制蒙版图像；最终建立的空地混合映射图像

最近，由于异构系统的互补性，机器人技术中的空地合作领域吸引了许多研究。一方面，无人机具有很高的敏捷性，但有效载荷却很低，只能飞行有限的时间。另一方面，地面机器人的移动性受到限制，但是其有效载荷很高，并且可以处理长期任务。此外，将异构系统给出的不同视角组合在一起，可以拓宽地面机器人的有限感知范围。空地协同有几种应用场景：无人机搭载摄像头扩展感知范围；无人机建立全局视图管理团队机器人；地面机器人作为无人机的充电、搭载、发射平台；无人机测绘地面机器人无法感知的区域。

考虑到协作系统，空中和地面系统之间的定位和地图共享是具有挑战性的问题。这项工作解决了这些问题，旨在通过增强的空中传感器感知能力来构建地面可遍历地图。最初在1999年提出了基于鸟瞰图导航地面机器人的概念证明。最近，无人机被用于避障和路径规划，以驱动地面机器人。实际上，为了有效导航，移动机器人需要有关环境的信息。为了获得它，机器人可以探索其环境，或者在合作的背景下，将此任务留给更合适的机器人来完成。因此，目标是使用无人机生成地面机器人可以使用的全局地图。但是，大多数情况下，这些地图是在任务执行前使用通用参考系离线创建的。与现有方法不同，我们考虑在线合作制图，其中在探索过程中构建了增强地图，从而克服了视图之间的极端透视差异和缺乏通用参考系的问题。

几项研究考虑了在大型结构化室外环境中空地协同建图可遍历性的问题。Vidal, 2011提出了一种基于图像特征（例如3D点和线）的几何SLAM方法。另一种方法使通过使用单应性和连续图像之间的相关性提取图像中的平面，可以将可遍历地图计算为随机网格。这些方法提供了密集的映射，但通常会在大范围内消耗大量内存。其他工作使用拓扑建模来构建结构化环境的表示。这些方法消耗的内存更少，并提供结构表示，类似于用于导航的人类认知图。对于室外环境，道路网通常也使用图形建模。然而，仅拓扑信息通常不足以在地面上引导机器人并定义导航策略。在这种情况下，带有拓扑和度量信息的混合图更合适。Lisien, 2005定义了层次图集（hierarchical atlas），这是专为在大型环境中运行的机器人设计的地图模型。它包括两个层次，其中最高层次是描述可遍历地面的拓扑图，而较低层次是特征的集合。这种两级体系结构允许进行高级规划和低级导航。

在本文中，首先解决协作映射的问题，即创建一种编码地面可遍历性的混合（拓扑和度量）表示形式。然后，提出了一种多步算法，用于从空中和地面视线对所构建的表示进行图匹配和地图确定。这导致创建一个增强的地图，该地图在空间上与鸟瞰图保持一致，并处理地面视图的准确局部几何信息。为了构建地面遍历混合图，我们首先使用基于距离变换的高效实时骨架化算法；然后，我们将其扩展为对可遍历地面的拓扑和局部几何信息进行编码的图形表示。创建的地图适用于地面导航和规划。

无人机建立的地图，橙色代表道路绿色代表路口

UGV的原始图像；地面投影图像；本地混合遮罩图

结构图：将地图进行匹配然后合并

地面地图（左）与无人机地图（右）进行匹配

建立的混合增强地图：橙色代表无人机空中地图，蓝色代表无人车地面地图

https://link.springer.com/article/10.1007/s10514-019-09872-1link.springer.com

Renaudeau, B., Labbani-Igbida, O. & Mourioux, G. Air-ground cooperative topometric mapping of traversable ground. Auton Robot 44,705–720 (2020).