导航动态避让算法RVO的优化ORCA(Optimal Reciprocal Collision Avoidance)

来源于文档的主要内容:
ORCA主页
文档来源
本文要解决的问题:
n(n>0)n(n>0)n(n>0)个个体导航向目标点移动过程中,对于其它个体或者障碍物进行动态避让,并寻找最佳路径向目标点移动。


和A星寻路算法有什么异同?
相对而言,
ORCA是局部导航,导航目标是在个体自己的周围,让个体自身避开与自己接近的其它个体目标和障碍,ORCA只能感知到靠近自身周围的情况,没有全局环境的信息,所以它只管导航时不与自己周围其它个体目标和障碍避免碰撞,或者说重叠在一起,却不能为自身起点和目标点之间找到最短路径,这刚好是A*星寻路解决的问题。
A星寻路算法刚好和ORCA形成互补:
A星是全局寻路算法,会根据配置最大可能的保证找到导航个体自身起点到目标点的最短路径,算法的全局信息中有着整个环境的障碍信息。但A星没有感知所有导航个体的具体状态和周围的“交通状况”信息,所以A星算法不处理可能会碰撞问题,因此多个导航个体之间可能会重叠在一起。这刚好是ORCA解决的问题。
所以可以把它们结合起来,形成互补,Unity有个插件A星 Pathfinding Project Pro就是将两者结合起来了,形成动态避让的全局导航。

我们在本文中讨论的问题正式定义如下:
在一个共享的空间环境下有n(n>0)n(n>0)n(n>0)个机器人,为了简单起见,我们假设机器人都是圆形,空间环境则为2D空间。(这样我们在此中更容易提出定义和算法,也能适用于多维)。每个机器人AAA都有一个当前位置pAp_{A}p 
A
​    
 (圆盘的中心点)、当前速度vAv_{A}v 
A
​    
 和半径rAr_{A}r 
A
​    
 ,这些参数都是机器人的外在状态,它们可以被其他机器人观察到。此外,当每个机器人往目标点方向的路上没有其它机器人阻挡时,都有最大速度 vmaxAv_{A}^{max}v 
A
max
​    
  和期望速度 vprefAv_{A}^{pref}v 
A
pref
​    
 (vprefAv_{A}^{pref}v 
A
pref
​    
 直接指向目标点,它的长度等于vmaxAv_{A}^{max}v 
A
max
​    
 ),但这些事机器人的内部参数,无法被其它机器人观察到。
解决方案:
我们提出了一个严格的方案,假设有nnn个个体,他们之间使用相同的避免碰撞策略,提供充足条件下,他们相互在ttt时间内避免碰撞的方案。
这个方案基于速度,这意味着每个机器人都会考虑到其它机器人的速度避免与他们碰撞,然后从他自己的可选速度空间区域中选择自己的新速度,其它被标为"禁止"的区域则被其它机器人占据。对于每个其它机器人,当前机器人都有一个半平面(速度空间)的可选速度,用来与其它机器人避免碰撞。那么当前机器人可以从这些可选的多个平面的交集中选择一个最佳的速度,这个可以通过线性划分有效的完成。线性划分在机器人密集的环境下可能不可行,在这种情况下,我们通过三维空间来选择“尽可能安全”的速度。
我们要做的是:
第一,为每个机器人A同步独立地为它们自己选择一个新的速度 vnewAv_{A}^{new}v 
A
new
​    
 ,并且这个新速度 vnewAv_{A}^{new}v 
A
new
​    
  能够保证在预定的t时间内,持续的与别的机器人无碰撞移动。
第二,每个机器人选择新速度 vnewAv_{A}^{new}v 
A
new
​    
 时,都要尽可能的接近它们自己的期望速度vprefAv_{A}^{pref}v 
A
pref
​    
 。
第三,每个机器人之间不允许进行沟通,所以它们只能够观察得到别的机器人的当前位置和当前速度。然而,每个机器人可以假设其它机器人也是使用和自己一样的策略来选择新的速度 vnewAv_{A}^{new}v 
A
new
​    
 。
这个问题无法使用中心协调的方式解决,因为每个机器人的期望速度只有它们自己知道。
第四节,我们描述为机器人选择时间t内避免碰撞的新速度准备了足够多的条件。
第五节,展示了如何使用此原理循环多个机器人导航。

所以,整篇文章主要部分要解释的动态避让效果也就如下图所示:
也就是要达成如下效果图这般动态避让导航的样子,走位四不四很风骚? ^ ^。

图解:
以红色圆为主角,我们假设他叫AAA,其它颜色的圆各叫BCDEFBCDEFBCDEF等。
图中各种颜色的直线就是上述的平面的分割线,分给A的半平面下文称为ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 。白色区域是AAA避开多个其它颜色圆的多个半平面的交集区域,也就是自己的可选速度范围,下文称为ORCAtAORCA_{A}^{t}ORCA 
A
t
​    
 (白色区域图中)。左边黑色点位置是目的地点,主角AAA的期望速度vprefAv_{A}^{pref}v 
A
pref
​    
 (图中灰色线段)总是指向它,毕竟那是自己要去的地方嘛。而主角AAA的当前速度 voptAv_{A}^{opt}v 
A
opt
​    
 (图中黑色线段)也想指向它,却无奈被限制在白色区域里,但它不死心,所以它每在下一步选择新速度vnewAv_{A}^{new}v 
A
new
​    
 (图中的黑色线段的下一步状态)都会尽可能的向灰色速度靠近,直到到达目的地。由此,风骚走位图形成

4.1准备
有两个机器人AAA和BBB,障碍速度集合为VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
 (解释为:A在此集合中选择此速度时,将在时间ttt内与BBB发生碰撞)。
设DDD为以ppp为圆心,rrr为半径的圆:

DDD(ppp,rrr) = {qqq| ||q−p|| < $rrr}

那么:

VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
  = {vvv|∃ttt ∈\in∈ [000,τττ] :: tvtvtv ∈\in∈ DDD(pBp_{B}p 
B
​    
  −pAp_{A}p 
A
​    
 , rAr_{A}r 
A
​    
  + rBr_{B}r 
B
​    
 )}

有:
(a)两个机器人A和B
(b)这里是速度空间坐标系,障碍速度集合 VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
  几何解释为(灰色区域)形成一个截头的圆锥形,顶点位于原点o(速度空间),它的两边与rAr_{A}r 
A
​    
  + rBr_{B}r 
B
​    
 相切,两边居中为pBp_{B}p 
B
​    
  −pAp_{A}p 
A
​    
 方向上。圆锥的半径由t决定,这里的障碍速度t=2。
(c)避免碰撞向量集合CAtA∣BCA_{A|B}^{t}CA 
A∣B
t
​    
  :避免发生碰撞情况下,BBB的选择速度集合为VBV_{B}V 
B
​    
 (深灰色),这里为坐标系的第四象限,也就是说明BBB的速度集合方向为向右下,那么给AAA的选择的速度集合CAtA∣BCA_{A|B}^{t}CA 
A∣B
t
​    
 也就是 VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
 的Minkowski sum的补集。
(PS : 临阵磨枪,脑补一下)Minkowski sum的大概定义如下:
设XXX⊕YYY表示为X和Y的Minkowski sum,绿色为XXX蓝色为YYY,红色为和:
XXX ⊕YYY = {xxx+yyy|xxx ∈\in∈ XXX, yyy ∈\in∈ YYY},


障碍速度的几何解释如(b)所示,记住:CAtA∣BCA_{A|B}^{t}CA 
A∣B
t
​    
 和 CAtB∣ACA_{B|A}^{t}CA 
B∣A
t
​    
 相对于原点是对称的。
设vAv_{A}v 
A
​    
 和vBv_{B}v 
B
​    
 分别为机器人AAA和BBB的当前速度,根据障碍速度的定义意味着,如果vAv_{A}v 
A
​    
 − vBv_{B}v 
B
​    
 ∈\in∈ VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
 ,那么AAA和BBB持续以当前速度移动将在时间ttt 内碰撞。相反,如果vAv_{A}v 
A
​    
 − vBv_{B}v 
B
​    
  ∉\notin∈ 
/
​    
  VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
 那么AAA和BBB在ttt 时间内不会碰撞。

那么对应任何vBv_{B}v 
B
​    
 ,如果vBv_{B}v 
B
​    
 ∈\in∈ VBV_{B}V 
B
​    
 和vAv_{A}v 
A
​    
 ∉\notin∈ 
/
​    
  VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
  ⊕VBV_{B}V 
B
​    
 ,那么AAA和BBB以当前速度在ttt时间内是保证不会碰撞的,从而推导出避免碰撞速度集合CAtA∣BCA_{A|B}^{t}CA 
A∣B
t
​    
 (VBV_{B}V 
B
​    
 ),也就是在BBB选择vBv_{B}v 
B
​    
 速度后AAA能够选择的速度集合。见图©:

CAtA∣BCA_{A|B}^{t}CA 
A∣B
t
​    
 (VBV_{B}V 
B
​    
 ) = {vvv|vvv∉\notin∈ 
/
​    
  VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
  ⊕VBV_{B}V 
B
​    
 } (图c公式)

对于AAA和BBB的速度集合VAV_{A}V 
A
​    
 和VBV_{B}V 
B
​    
 ,如果VAV_{A}V 
A
​    
 ⊆\subseteq⊆CAtA∣BCA_{A|B}^{t}CA 
A∣B
t
​    
 (VBV_{B}V 
B
​    
 ) 和 VBV_{B}V 
B
​    
 ⊆\subseteq⊆CAtB∣ACA_{B|A}^{t}CA 
B∣A
t
​    
 (VAV_{A}V 
A
​    
 ) ,那么,AAA和BBB相互不碰撞。
如果VAV_{A}V 
A
​    
 =CAtA∣BCA_{A|B}^{t}CA 
A∣B
t
​    
 (VBV_{B}V 
B
​    
 ) 和 VBV_{B}V 
B
​    
 =CAtB∣ACA_{B|A}^{t}CA 
B∣A
t
​    
 (VAV_{A}V 
A
​    
 ) ,那么,我们称VAV_{A}V 
A
​    
 和VBV_{B}V 
B
​    
 互为最大化。

4.2
因为AAA和BBB是相对独立的机器人,所以它们应该在没有沟通的情况下,推断出自己被允许的速度范围,这里有无数对的VAV_{A}V 
A
​    
 和VBV_{B}V 
B
​    
 在遵循着这些要求。但在这些成对的VAV_{A}V 
A
​    
 和VBV_{B}V 
B
​    
 中,在他们互为最大化的可选的避免碰撞速度集合中选择一对接近最优的速度,称AAA的为voptAv_{A}^{opt}v 
A
opt
​    
 ,BBB的为voptBv_{B}^{opt}v 
B
opt
​    
 。( opt : optimization)
我们称以上这些避免碰撞可选范围AAA和BBB相互最大化的速度集合AAA的为ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 ,BBB的为ORCAtB∣AORCA_{B|A}^{t}ORCA 
B∣A
t
​    
 。

ORCAORCAORCA的具体描述
定义 1 (Optimal Reciprocal Collision Avoidance)
机器人A的ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 ,机器人B的为ORCAtB∣AORCA_{B|A}^{t}ORCA 
B∣A
t
​    
 的定义是,两边A和B避免碰撞,并且他们可选新速度范围互为最大化,以下用等式描述:

CAtA∣BCA_{A|B}^{t}CA 
A∣B
t
​    
 (ORCAtB∣AORCA_{B|A}^{t}ORCA 
B∣A
t
​    
 ) = ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
  和 CAtB∣ACA_{B|A}^{t}CA 
B∣A
t
​    
 (ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 ) = ORCAtB∣AORCA_{B|A}^{t}ORCA 
B∣A
t
​    
 

即以上等式解释为在时间ttt内避免与机器人BBB的ORCAtB∣AORCA_{B|A}^{t}ORCA 
B∣A
t
​    
 碰撞的向量区域,就是的机器人A的ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 ,反则反之。
那么有,

|ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 ⋂\bigcap⋂DDD(voptAv_{A}^{opt}v 
A
opt
​    
 ,rrr)| = |ORCAtB∣AORCA_{B|A}^{t}ORCA 
B∣A
t
​    
 ⋂\bigcap⋂DDD(voptBv_{B}^{opt}v 
B
opt
​    
 ,rrr)| ≥\geq≥ min(|VAV_{A}V 
A
​    
 ,DDD(voptAv_{A}^{opt}v 
A
opt
​    
 ,rrr)|,|VBV_{B}V 
B
​    
 ,DDD(voptBv_{B}^{opt}v 
B
opt
​    
 ,rrr)|)

这意味着ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 和ORCAtB∣AORCA_{B|A}^{t}ORCA 
B∣A
t
​    
 包含着更多速度接近voptAv_{A}^{opt}v 
A
opt
​    
 和voptBv_{B}^{opt}v 
B
opt
​    
 ,超过任何其它成对的速度的互相避免碰撞速度集合。它们允许选择的速度分布是均匀的,接近最优速度的速度集合数量AAA和BBB的相等。

我们构建ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 和ORCAtB∣AORCA_{B|A}^{t}ORCA 
B∣A
t
​    
 的几何图如下

假设AAA和BBB最优速度分别为voptAv_{A}^{opt}v 
A
opt
​    
 和voptBv_{B}^{opt}v 
B
opt
​    
 ,假设AAA和BBB一定会碰撞上,即voptAv_{A}^{opt}v 
A
opt
​    
 -voptBv_{B}^{opt}v 
B
opt
​    
 ∈\in∈VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
  。
设uuu是以voptAv_{A}^{opt}v 
A
opt
​    
 - voptBv_{B}^{opt}v 
B
opt
​    
  为起点,指向和到以VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
 边界最近的点为终点的向量:
uuu = (argminargminargmin∣∣||∣∣vvv−(voptAv_{A}^{opt}v 
A
opt
​    
 −voptAv_{A}^{opt}v 
A
opt
​    
 )∣∣||∣∣)−(voptAv_{A}^{opt}v 
A
opt
​    
 −voptAv_{A}^{opt}v 
A
opt
​    
 )),vvv∈\in∈∂VOtA∣B∂ VO_{A|B}^{t}∂VO 
A∣B
t
​    
 
∂偏导符号∂偏导符号∂偏导符号

设n是∂VOtA∣B∂VO_{A|B}^{t}∂VO 
A∣B
t
​    
 范围内向,以(voptAv_{A}^{opt}v 
A
opt
​    
 −voptBv_{B}^{opt}v 
B
opt
​    
 )+uuu为起点向外的法线,那么uuu是对于AAA和BBB在时间ttt内避免碰撞速度需要改变最小的值。为了避免碰撞,机器人以公平的方式"分担责任",机器应该适配自己的速度为1/2u1/2u1/2u。
(我们引入这些voptvoptvopt(优化速度)来概括ORCAORCAORCA的定义。实际上,这些voptvoptvopt等于当前的速度,机器人必须偏离当前轨道来避免可能的碰撞,更多选择在5.2节讨论)

如图:

Fig.2Fig.2Fig.2
AAA的ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 跟B避免碰撞的向量集合是一个半平面,被垂直于向量uuu且经过点voptAv_{A}^{opt}v 
A
opt
​    
 +1/2u1/2u1/2u的线分割。
uuu是以voptAv_{A}^{opt}v 
A
opt
​    
 - voptBv_{B}^{opt}v 
B
opt
​    
  为起点,指向和到以VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
 边界最近的点为终点的向量。
nnn是VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
 范围内向,以(voptAv_{A}^{opt}v 
A
opt
​    
 - voptBv_{B}^{opt}v 
B
opt
​    
 )+uuu为起点方向向外的法线。

ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 允许A的避免碰撞速度集合是以voptAv_{A}^{opt}v 
A
opt
​    
 +1/2u1/2u1/2u为起点,以nnn为方向的半平面;BBB的允许速度集合同理。
ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
  = {vvv∣|∣(vvv−(voptAv_{A}^{opt}v 
A
opt
​    
  +1/2u1/2u1/2u))· nnn ≥ 000}.
以上等式在可能不会碰撞时也有效,即voptAv_{A}^{opt}v 
A
opt
​    
 −voptBv_{B}^{opt}v 
B
opt
​    
 ∉\notin∈ 
/
​    
 VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
 时。
以上说明每个机器人之间不通过沟通就能观察到彼此之间的大概位置、半径和速度。
这种情况下两个机器人个承担一半保持无碰撞的责任。

5 n个个体避免碰撞
在本节中,我们将展示如何应用上面定义的ORCA原理来实现多个移动机器人之间的n体碰撞避免,并讨论如何在这个框架中加入静态障碍。

10. Mermaid 流程图
感知其它机器人的位置和速度
计算机器人彼此之间的ORCA
使用线性划分选择新的速度
将速度应用于更新机器人位置
Fig.3Fig.3Fig.3
每个机器人的感知和反应循环示意图

5.15.15.1基本方案
每个机器人AAA在时间ttt内执行连续循环的感知和做反应。 在每次循环中,机器人需要知道自己的和其它机器人的半径、当前位置和当前速度,基于这些信息,机器人AAA推断出自己的对于机器人BBB的ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 半平面。在这个半平面内允许的速度范围内,AAA又和其它机器人产生半平面,如此之间不断影响,我们定义此为ORCAtAORCA_{A}^{t}ORCA 
A
t
​    
 ,(见Fig.4Fig.4Fig.4)
ORCAtAORCA_{A}^{t}ORCA 
A
t
​    
  = DDD(((000,,,vmaxAv_{A}^{max}v 
A
max
​    
 )))⋂\bigcap⋂ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
  其中 (((BBB≠\neq 
̸
​    
 =AAA))) (7)
请注意,此定义还包括机器人A的最大速度限制。
接下来,避免碰撞允许速度范围内所有的速度,机器人选择一个最接近它的期望速度vprefAv_{A}^{pref}v 
A
pref
​    
 的新速度vnewAv_{A}^{new}v 
A
new
​    
 :
vnewAv_{A}^{new}v 
A
new
​    
 = argmin∣∣v−argmin||v-argmin∣∣v−vprefAv_{A}^{pref}v 
A
pref
​    
 ∣∣,v∈||,v∈∣∣,v∈ORCAtAORCA_{A}^{t}ORCA 
A
t
​    
 (8)
我们将在下面展示如何计算这个实际应用的新速度。 更新机器人
达到新的位置;
pnewAp_{A}^{new}p 
A
new
​    
 = pAp_{A}^{}p 
A
​    
  +vnewAv_{A}^{new}v 
A
new
​    
 Δt∆t∆t , (9)
所有的感知-反应都是(7)(8)(9)这个循环过程。
上述过程中的关键步骤是计算新的速度vnewAv_{A}^{new}v 
A
new
​    
 ,也就是(7)和(8)的定义。这可以使我们有效的使用线性规划算法完成,如ORCAtAORCA_{A}^{t}ORCA 
A
t
​    
 是受多个机器人影响产生多个半平面共同内由线性规划约束引起的交集区域,见下图Fig.4Fig.4Fig.4。最优的解就是此区域速度集合中的某个速度到期望速度vprefAv_{A}^{pref}v 
A
pref
​    
 的距离,甚至这是个二次最优函数也不影响线性规划算法的特性,因为它只有一个局部最小值。
我们使用[3]的有效算法,它逐个添加约束
随机顺序,同时跟踪当前最佳新速度

Fig.4Fig.4Fig.4
(a)8个机器人的,它们各自的速度用箭头表示。
(b)A的受多个机器人影响的多个半平面t=2t=2t=2和vopt∗v_{*}^{opt}v 

opt
​    
 =v∗v_{*}^{}v 

​    
 )。EEE和CCC的半平面重合,虚线区域是AAA的多个半平面交集区域,也就是避免碰撞被允许的新速度选择区域范围。

算法目的是在ORCAtAORCA_{A}^{t}ORCA 
A
t
​    
 中找到最接近vprefAv_{A}^{pref}v 
A
pref
​    
 的新速度vnewAv_{A}^{new}v 
A
new
​    
 ,如果线性规划算法不可行,即ORCAtAORCA_{A}^{t}ORCA 
A
t
​    
  =0= 0=0.,那么返回失败。vmaxAv_{A}^{max}v 
A
max
​    
 的调整不会影响算法的运行。

如果谨慎选择机器人的优化速度(我们将在5.2节讨论),ORCAτA将不会是空的,因此,总有一种解决方案可以保证机器人在t时间内无碰撞。

我们可以通过不包括所有其他机器人的约束来提高选择速度的效率,仅仅考虑那些“靠近”的机器人。 事实上,机器人B离机器人A的距离远远超过(vmaxA + vmaxB)那么时间t内是不会与机器人发生碰撞,因此在计算机器人A的新速度时可以安全地将它们排除在线性规划算法之外。还有一个小问题是机器人A不知道其他机器人的最高速度,但这可以通过“猜测”来解决,其它机器人的最高速度等于A的自身。
关于附近机器人的约束影响,可以使用kD树来寻找附近的机器人。

Fig.5Fig.5Fig.5
(a)3个机器人BCDBCDBCD密集的向机器人AAA移动。
(b)机器人彼此之间的参数t=2t=2t=2和vopt∗v_{*}^{opt}v 

opt
​    
 =v∗v_{*}^{}v 

​    
 ,那么区域ORCAtA是空的,所以ttt时间内无法保证没有碰撞。
©机器人彼此之间的参数t=2t=2t=2和vopt∗v_{*}^{opt}v 

opt
​    
 =000,那么得出灰色区域是ORCAtAORCA_{A}^{t}ORCA 
A
t
​    
 。

5.2选择最优速度
还有一个问题,如何为每个机器人AAA 选择voptAv_{A}^{opt}v 
A
opt
​    
 。为了让机器人在没有通信的情况下推断出半平面,voptAv_{A}^{opt}v 
A
opt
​    
 必须是可被其它机器人观察得到的。
在这里,我们讨论一些合理的可能性:
voptAv_{A}^{opt}v 
A
opt
​    
 =000 对应所有的机器人AAA:
这就保证了ORCAtAORCA_{A}^{t}ORCA 
A
t
​    
 对于机器人A非空。如上所述,那么线性规划算法将最快为所有机器人找到保证时间t内避免碰撞的速度。对应多个机器人B,点0始终位于障碍速度VOtA∣BVO_{A|B}^{t}VO 
A∣B
t
​    
 之外,因此半平面ORCAtAORCA_{A}^{t}ORCA 
A
t
​    
 总是包含最小速度000。实际上,这条线界定了ORCAtAORCA_{A}^{t}ORCA 
A
t
​    
 垂直于连接AAA和BBB的线。
将优化速度设置为000的缺点是机器人的行为看起来不自然,因为它们只考虑了别的机器人的当前位置,而不是它们的速度,在密集的情况下也可能导致全局僵硬,因为机器人的速度彼此非常接近000。
voptAv_{A}^{opt}v 
A
opt
​    
 =vprefAv_{A}^{pref}v 
A
pref
​    
  对应所有的机器人AAA:
期望速度是机器人的内部状态,因此别的机器人无法观察得到。为了能讨论下去,我们假设某种程度上可以推断出其它机器人的期望速度,然后让所有机器人的优化速度等于期望速度,这在低密度条件下运行很好,但随着优化速度的幅度递增,线性规划算法变得越来越不可行。在大多数情况下,无论密度环境如何,期望速度都具有恒定(大)长度,这将导致即使在均匀的密度环境中导航看起来也不自然。
voptAv_{A}^{opt}v 
A
opt
​    
 =vAv_{A}^{}v 
A
​    
  对应所有机器人AAA:
这里的优化速度是以上两种的理想权衡,在低密度环境下选择偏向期望速度,在高密度环境下选择偏向000速度,当然,当前速度要被其它机器人观察得到。
尽管如此,在高密度环境下,线性规划算法依然有可能不可行(见Fig.5(b)Fig.5(b)Fig.5(b)),这种情况下不能保证选择出一个避免碰撞的速度。为此,我们使用3-D线性规划算法为机器人选择“尽可能安全”的速度(我们在5.3节讨论)。
5.3 密集条件环境
对于所有机器人AAA,我们选择voptAv_{A}^{opt}v 
A
opt
​    
 =vAv_{A}^{}v 
A
​    
 ,在机器人密度极高的情况下,可能会ORCAtAORCA_{A}^{t}ORCA 
A
t
​    
 为空(见图5(b)),并且5.1的算法返回是不可行的,在这种情况下无法保证有无碰撞速度。
这种情况下,我们为每个机器人选择“尽可能安全”的速度,即速度最低限度的“穿透”其它机器人引起的约束。
正式点的说,就是设 dA∣B(v)d_{A|B}^{}(v)d 
A∣B
​    
 (v)为速度vvv到半平面ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 的边界的距离。如果v∈v∈v∈ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 ,那么dA∣B(v)d_{A|B}^{}(v)d 
A∣B
​    
 (v)为负。我们要选择最小的可行速度,选的也就是速度到多个机器人影响的各个平面的距离中最大的一个。

vnewAv_{A}^{new}v 
A
new
​    
 = argminargminargmin maxmaxmax dA∣B(v)d_{A|B}^{}(v)d 
A∣B
​    
 (v) 其中 v∈D(0,v∈D(0,v∈D(0,vmaxAv_{A}^{max}v 
A
max
​    
 ))),,,BBB≠\neq 
̸
​    
 =AAA

几何上,这可以解释为以相同的速度,向外垂直移动半平面ORCAtA∣BORCA_{A|B}^{t}ORCA 
A∣B
t
​    
 的边缘,直到恰好得到一个有效的速度,这也就是我们要选的最小可行速度。
我们可以使用三维线性规划算法找到这个速度。对于每一个其它机器人BBB,距离函数 dA∣B(v)d_{A|B}^{}(v)d 
A∣B
​    
 (v)在三维(v,d)(v,d)(v,d)空间中是一个平面。我们通过距离函数来寻找一个点(v∗,d∗)(v*,d*)(v∗,d∗),它位于所有的平面之上,找到它的最小值ddd,然后设置vnewAv_{A}^{new}v 
A
new
​    
 ===v∗v_{*}^{}v 

​    
 。
实际上,我们可以将问题投射到v平面上,这样所有的几何形状操作可以二维进行,三维线性规划算法总是可行的,所以它总是返回一个解决方案。
请注意,在这些密集的情况下,为机器人选择的新速度不会取决于机器人的期望速度。 这意味着机器人’顺其自然流动’,其行为完全由机器人周围的机器人决定。
效果如图:


关于静态障碍:


Fig.6Fig.6Fig.6
(a)机器人AAA和线段障碍物OOO的配置。
(b)障碍速度的几何形状VOtA∣OVO_{A|O}^{t}VO 
A∣O
t
​    
 ,t=2t=2t=2。
(c)半平面切割线ORCAtA∣OORCA_{A|O}^{t}ORCA 
A∣O
t
​    
 与VOtA∣OVO_{A|O}^{t}VO 
A∣O
t
​    
 相切于边上到voptAv_{A}^{opt}v 
A
opt
​    
 最近的点,等于0时为碰到障碍OOO。

5.4 静态障碍物
到目前为止,我们只讨论过机器人如何避免相互碰撞,但是
典型的多机器人环境也包含(静态)障碍物。 我们可以很容易地将它们纳入上述框架中。 我们基本上遵循以上相同的方法,一个关键的区别是障碍物不移动,所以机器人应该完全负责避免与他们发生碰撞。

我们通常可以假设障碍物被建模为线段的集合。 设OOO是这样的线段之一,AAA是半径为rAr_{A}^{}r 
A
​    
 ,位于点pAp_{A}^{}p 
A
​    
 的机器人。那么由OOO影响的障碍速度VOtA∣OVO_{A|O}^{t}VO 
A∣O
t
​    
 定义如下:
VOtA∣OVO_{A|O}^{t}VO 
A∣O
t
​    
  === {v|∃t ∈ [0,τ] :: tv ∈ O⊕ −D(pAp_{A}^{}p 
A
​    
 ,rAr_{A}^{}r 
A
​    
 )}.
如果其速度vAv_{A}^{}v 
A
​    
 在VOtA∣OVO_{A|O}^{t}VO 
A∣O
t
​    
 内,则代理AAA将在τττ时间内与障碍物OOO碰撞,反之则在t时间内避免碰撞。因此,对应障碍OOO,AAA允许的速度区域为VOtA∣OVO_{A|O}^{t}VO 
A∣O
t
​    
 的补集。这个补集是一个非凸区域,所以无法使用5.1的划线算法,为此,对于障碍O,我们定义了A可允许的速度集合ORCAtA∣OORCA_{A|O}^{t}ORCA 
A∣O
t
​    
 的半平面:划分线为为切线过VOtA∣OVO_{A|O}^{t}VO 
A∣O
t
​    
 边界上一个最接近voptAv_{A}^{opt}v 
A
opt
​    
 的点(见图Fig.6(c)Fig.6(c)Fig.6(c))。

Fig.7Fig.7Fig.7
两个机器人的踪迹模拟,机器人显示为彩色磁盘它们的初始位置很轻,随着时间的推移变暗。
(a)两机器人通过彼此的踪迹。
(b)五个机器人去到彼此对面点的踪迹。

如果遇到障碍,对于所有机器人A我们选择voptAv_{A}^{opt}v 
A
opt
​    
 =0=0=0,A=0A = 0A=0.这保证了
机器人始终存在有效的速度,以避免在τ时间内与障碍物发生碰撞。 对于障碍物而言,我们通常可以使用比其他机器人更小的τ值,因为机器人需要避开其它机器人的情况下,通常不应该对障碍物“害羞”不敢向障碍物靠近。
另一方面,对于机器人在障碍物上允许的速度的限制不与障碍碰撞很难,应该不惜一切代价避免与障碍物碰撞。
我们注意到避免与障碍碰撞的速度集合半平面只保证机器人不与障碍碰撞,没有让机器人绕开障碍移动,这有可能与期望速度方向相反,也就是非最短路径,这应该用全局寻路导航来处理,例如A*寻路啦。
————————————————
版权声明:本文为CSDN博主「漫漫之间n」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/u012740992/article/details/89397714

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值