为互联的自动驾驶车辆设计的分散协同换道决策(翻译自Decentralized Cooperative Lane-Changing Decision-Making for Connected Auton...

为互联的自动驾驶车辆设计的分散协同换道决策

 

摘要

在这篇文章中,我们为互联的自动驾驶车辆提出了一种分散协同车道变换决策框架,其由三部分组成,即:状态预测,候选决策生成以及协调。换句话说,车联网中的每一辆车独立做出协同换道决策。在状态预测模块中,我们采用现存协同车辆跟驰模型来预测车辆未来的状态。在候选决策生成模块中,我们提出了基于激励的模型来生成候选决策。在候选决策协调部分,我们提出了一种算法来避免可能导致车辆碰撞或交通状况恶化的候选换道决策以得到最终的决策。此外,本文在数值仿真实验中研究了分散协同换道决策框架的交通稳定性、同质性、均匀性和安全性。评估了一些稳定性、效率、同质性以及安全性指标,并且这些指标显示了我们提出的框架在交通动力学上的巨大潜力。

关键词:车联网,分散协同换道决策框架,状态预测模块,候选决策生成模块,候选决策协调模块

 

引言

在一个互联的环境中车辆与周围的基础设施以及其它车辆沟通正在成为现实。互联车辆可以通过双向通信设备和传感器获取并报告相邻车辆的交通状况。车联网技术使得车辆间的协作成为可能并且将提供关于这些车辆的丰富、实时的信息。它们的作用体现在如下两个方面:(1)在宏观层面,车联技术可以改善交通稳定性,效率,安全性以及能源消耗;(2)在微观层面,车辆动力学和驾驶策略都发生了改变。同时,自动驾驶车辆快速发展以自动准确地执行驾驶行为。然而,自动车辆仅依赖于基于物理网络传感技术的车载传感器,这限制了车辆的感知范围。因此,车联网是未来几十年引入交通行业的潜在的最具变革性的技术之一,为车辆技术和交通商业模式都提供了崭新的机会。因此,为CAVs进行车辆跟驰以及换道行为建模,并研究其在交通流上的效果已经成为交通理论社区中的基本话题。然而,现存的相关研究主要关注车辆跟驰行为而相对忽略了换道行为,尤其是换道决策问题。为了在微观层面为CAVs决定最优换道时间与地点,我们提出了分散协同换道决策框架(DCLDF)。DCLDF有状态预测模块,候选决策生成模块,以及候选决策协调模块构成。在候选决策生成模块和候选决策协调模块中,我们分别提出了新的基于激励的模型和协调避免碰撞的算法来进行决策选择。通过一个数学模拟实验,我们研究了DCLDF在交通稳定性,有效性,同质性以及安全性上的效果。模拟结果显示了DLCDF在交通动力学中的巨大潜力。

本文余下部分按如下组织:第二部分描述了相关的工作。提出的DCLDF在第三部分进行了详细阐述。在第四部分讨论了数值模拟实验设计并分析了结果。最后一部分展示了结论和未来的研究方向。

 

相关工作

一些文章通过在车辆跟驰模型中考虑某一辆车前行或后行车辆超过一辆的情形测试了相连车辆情形。为了增加道路交通的移动性,文献[1]中的Ge和Orosz提出了一种基于加速的连接巡航控制理论,通过无线车车(vehicle-to-vehicle, V2V)通信获得并使用多辆前行车的加速信息。文献[2]中Monteil提出了一种多预期协同规律,将多辆前行车的状态信息(距离、速度等)引入FVDM模型,并配以换道模型MOBIL。基于多期望协同规律,文献[3]中将智能驾驶模型(IDM)改良以适应于V2X(车辆与车辆间,车辆与基础设施间)通信。在这些模型中,协作车辆的带权重信息和嵌入式传感器的失误都被考虑在内。研究表明,这些改良的模型考虑到了周围车辆的信息,为交通状况的稳定性和同质性做出了贡献。

由于涉及复杂的运动,相较于车辆跟驰方面的研究,有关互联环境中协同换道规则方面的研究相对较少。汽车制造商,如Volvo、Ford以及Audi,已经在换道预警系统(LCWS)方面做出了一些研究,这些系统能够判断其它车辆是否位于某辆车的盲区。文献[8]通过分析某辆车与其周围四辆车的安全距离改进了LCWS,其中这四辆车分别位于主车辆的后方、前方或目标车道的相邻位置。文献[9]提出了一个预测换道轨迹的多项式模型,该模型还可用来分析主车辆与周围车辆的碰撞风险。

LCWS模型主要考虑到主车辆的安全性,但倾向于忽略掉换道对周围车辆和交通流的影像。文献[10]提出了一种应用于主车辆与目标车道上位于主车辆之后或之前两辆车之间的集中式协同换道策略。CLC策略的目标为减少换道行为对后行车辆的影响。CAV的换道决策问题可以建模为微分博弈问题,将前行与后行车辆的加速问题考虑在内以优化联合代价函数。博弈理论方法被采用以内源性地考虑到车联网环境中的信息流,并且提出的换道模型可以评估换道行为是否有益于主车辆与其周围四辆车的加速过程。上面提到的研究证明协同环境使许多明智的换道决策成为可能。然而,值得一提的是,已存在的协同换道决策只考虑到至多四辆车的相互。这种不完整的信息并不总适用于真实的车联网环境。在前述协同车辆跟驰模型中,有可能考虑到在换道过程中有更多的车辆交互。相应的,这将增加控制问题的难度和计算负荷。为了进行大量互联车辆的协同控制,集中式通信与优化在现实中是不可行的。需要为实时实现,设计分布式算法。

 

分散协同换道决策框架

A. 决策机制设计假设

本文研究假定每一辆车都是一辆CAV,它会基于其周围交互车辆及其自身的驾驶条件独立地做决定。如图1所示,我们定义那些行驶在目标车辆当前与相邻车道上,目标车辆通信范围内的车辆为周围交互车辆。主车辆,它的前行车辆与后行车辆分别以“SV”,“LV”和“FV”指代。SV的目标车道用“T”指代,SV在T上推定的前行车辆与后行车辆分别用“PLV”和“PFV”指代。此外,我们的研究基于如下两个假设:

(1)CAV总是从从周围车辆及时接收相关信息,而不存在通信延迟。

(2)换道执行过程是瞬间行为。因此,在微观层面,我们主要研究和分析纵向运动,本文之后的部分中提到的加速(减速)都指纵向加速。

图2显示了为CAV设计的DCLDF的一个概略表达(灰色矩形框),其由三个主要模块组成:状态预测模块,候选决策生成模块,以及候选协调模块。系统状态由CAV的位置,加速,速度以及它周围交互的车辆表达。目前的系统状态信息通过V2V通信传递给状态预测模块。状态预测模块以当前系统状态作为初始状态,采用协作汽车跟驰模型来预测相关车辆接下来的状态。在候选决策生成模块中,基于系统状态预测结果,确定最优决策变量以优化有利条件,这反映了不期望的和期望的状态并形成了候选决策,也即关于是否换道。一旦生成了候选决策,其便立即通过候选决策生成模型广播给周围交互的车辆。当候选决策协调模型从它周围交互的车辆接收到了候选决策信息后,候选决策协调过程便被激发,并生成最终决策。最终决策又一次广播给周围交互的车辆并被车辆的低层推进、刹车与转向系统自动执行。当车辆移动时,系统状态变化,基于更新的系统状态信息,最优决策信号以一定的时间间隔被重新计算。在下文中,我们将详细描述DCLDF中的三个主要模块。

 

B. 状态预测模块

在状态预测模块中,为了预测相关车辆在下一个时间间隔处的状态,我们采用FVDM的改进版本。FVDM是由Monteil等人为车联网环境提出的状态预测模型。在本文的研究中,我们把FVDM的改进版本称作协同FVDM,记作C-FVDM。模型的公式如下所示:

公式(1)(2)(3)

其中代表车辆n的加速度,代表了车辆n的速度,和分别代表了车辆n+i和它的前行车辆n+i+1间的相对速度和距离。和是临近系数,它们定义了车辆n与其前行车辆(编号为0至m)间的交互强度。为简单起见,相关的速度和距离被分配以相同的权重,也即。如之前的研究所示,协同交通的不稳定条件表达为:公式(4) 

车辆间的交互减少了参数空间中不稳定区域的尺寸,这已被线性稳定性分析,或者更弱的非线性稳定性分析所证明。剩余参数的含义列于表格1中。这个特性的数学细节可参考文献[15]-[17].

 

C. 候选决策生成模块

下面将详细介绍每一辆车如何生成待选决策的详细方法。

为了对分散协同换道决策行为建模,候选决策模型必需容纳来自周围多辆汽车的信息。主车辆sv的候选决策生成模型公式依如下定义:

公式(5)-(9)

其中C和T分别代表了主车辆sv目前的车道和目标车道; L和R分别代表了左、右目标车道;U(sv, C, T)代表了在协作状态下,主车辆sv的总体换道决策优势;Nc和NT分别代表了在通信范围内,当前车道的后行车辆以及目标车道的推定后行车辆;a代表了车辆当前的加速度,a波浪代表了当主车辆换道时车辆的推定加速度。下标c和t分别指代属于Nc和Nt集的后行车辆;x代表了车辆的当前位置,Vs代表了在给定时刻车道S中的车辆集(除主车辆sv外);指代欧式距离;L是通信交互范围的大小。值得一提的是,目前技术上,无线交互范围的大小达到了750英尺,但我们选择的交互范围在这个阈值以下。在一个单跳广播的V2V交互环境中,可以保证车辆在这个通信交互范围内交换信息。注意到,的预测值是在前面提到的车辆互联环境中基于协同车辆跟驰模型计算而得的。

U(sv, C, T)的计算,也即公式(5)右边的部分,可以描述如下:第一项是主车辆sv换道到目标车道的优势。第二项,包含了礼貌因子p,考虑到了通信范围内目标车道上推定的后行车辆。第二项旨在减少不必要的以及侵略性的换道行为,这些行为有可能扰乱或损坏交通稳定性。计算结果总是非正的;因此,它的最小值代表了换道行为可能产生的最大影响。第三项,带有利益因子q,代表了由于主车辆潜在的换道可能而导致的当前车道内后行车辆的速度增长。第三项鼓励了换道行为对交通效率的正向作用。计算结果是非负的,因此,我们选择它的最大值。

如果不等式(8)和(9)都被满足了,基于公式(7),数据集中拥有最大U(sv, C, T)值的T被选作候选目标车道TS,此时相对应的候选决策为换道。否则,候选决策为不换道。

在不等式(8)中,是一个转换阈值,它决定了换道行为的整体优势是否大于不换道行为。不等式(9)为安全标准约束,它保证了主车辆和数据集中的车辆是安全的。是一个给定的安全减速值,它需要低于最大可能减速值。因此,不等式(9)不仅阻止了目标车道上车辆间的碰撞,也阻止了车辆以最大减速度刹车的紧急或极端情况的出现。此外,当在第三项中采用最小操作子以及第四项中采用最大操作子时,公式(5)中、不等式(8)与(9)中的参数可以从初始MOBIL策略继承而来。

 

D.候选换道决策协调模块

考虑到主车辆和它周围车辆交互的复杂性,在主车辆与它周围的交互车辆分别生成了换道决策后,主车辆需要采用某种协调策略以避免换道可能引起的冲突状况以做出最终的决策。在这部分,我们提出的协调算法的目标是为了避免如下冲突状况:某辆车频繁地离开并进入某车道,这显著减少了驾驶舒适度;多辆车进入相同的空隙,并且它们的入口位置过于接近;两辆车同时换道,并且据推算,一辆换道车会为另一辆换道车充当前行或后行车辆。特定的候选换道决策协调算法以伪码的形式详细描述如下。

 

模拟和结果

A. 数值模拟实验设计

模拟实验在MATLAB上进行,其考虑到了两种不同的情况。第一种情况不包含入口匝道,而另一种情况在最右边的车道上包含一个入口匝道。本文剩余部分将这两种情况分别称为方案1和方案2。两种情况初始都有600部车辆,它们被分配到三条车道,每条车道上200部车,初始车间距为30英尺,初始速度为每秒0英尺。在有入口匝道的情况中,初始车辆数为200,初始车间距为30英尺,初始速度为每秒0英尺。在相同的人车单元的条件下,会很快达到平稳的交通流状态。本文采用两种具有不同速度的车辆引入异质性,来避免这种现象。一组的速度均匀分布于80英尺/秒至120英尺/秒之间,另一组的车速均匀分布于52英尺/秒至79英尺/秒之间。第一组车速较快,其车辆占比约为20%,第二组车速较慢,其车辆占比达到80%。

为了进行比较,在模拟实验中测试了不同的驾驶行为,包括换道和车辆跟驰行为。如表2所示,这些驾驶模型组合包括MOBIL和FVDM,MOBIL和C-FVDM,DCLDF和C-FVDM,它们分别被记为组合1,组合2,和组合3。这些组合分别适用于在车辆跟驰和换道行为中都没有合作的情形,在车辆跟驰行为中有合作而在换道行为中没有合作的情形,在车辆跟驰和换道行为中都有合作的情形。模拟实验中,相关模型的参数值继承于[2]和[18],并且显示于表3。虽然技术上,最大无线交互范围在750英尺左右,我们在实验中设定信息交互范围为600英尺以提高可靠性。

 

B. 结果分析

在数值模拟实验中,不同的驾驶模型组合在交通稳定性、有效性、同质性和安全性方面的效果得到评估。

图3和4显示了分别采用组合1、组合2和组合3模型进行测试,最右边车道在两种模拟情形下的时空轨迹图。颜色代表了某一特定车辆在某一特定时间间隔处的速度。颜色值越大,车辆的速度越快。此处呈现的为300秒时间范围内的模拟结果。从图3(a)和4(a),我们看到,使用组合模型1时,产生一些停走波动。这个现象可以解释为由于忽略了公式(8)表达的线性稳定条件所致,而之所以这个条件会被忽略,源于其很难在没有协作的条件下被满足。此外,车辆单元的异质性以及在线性非稳定条件下频繁的换道行为很容易导致向下传播的扰动。从图3(b)和4(b)可以明显看到,协同车辆跟驰规则减少了,或者甚至消除了冲击波的生成。我们看到,在模拟实验中,我们看到协同车辆跟驰规则明显增加了车辆同质性。从图3(c)和4(c)中,我们可以看到冲击波被彻底消除了并进一步改善了同质性。从图3(a)和图4(a)到图3(b)和图4(b)的改善效果要比从图3(b)和图4(b)到图3(c)和图4(c)显著得多。这个可以解释为多前向车辆间的协调在纵向加速中被考虑到了。然而,交通效率的改善在图3(c)和图4(c)中并不明显。

此外,整个道路被划分为几个相邻的部分,每一部分100英尺长。从图5中可以看到,在同一道路段中,组合2的换道时间近似为组合1换道时间的一半。类似的,在同一道路段中,组合3的换道时间是组合2换道时间的一半。通常说来,换道越频繁,交通流稳定性越差。因此,我们可以得出结论,采用组合3模型时交通流的稳定性比采用其它两种模型时稳定性要强。文献[3]提出了一个相关的同质性度量指标Gd,并量化了一组不一致值,即,每一辆车在局部邻域内的速度方差。因此,Gd似乎是一个与同质性相关的度量。当Gd值为0时,代表了一个完美的同质流。图6显示,相较于采用组合模型2,当采用组合模型3时,组内异质值减少得更多。这表明,在协作车辆跟驰的条件下,为换道决策引入协作(在特定的通信范围内)可以改善交通同质性。图7代表了平均速度和密度间的关系,这反映了交通效率。从图6中我们可以看到,相较于组合模型2,组合模型3对整个模拟实验交通效率的改进只有一点,而相较于组合模型1,则改进了很多。总体说来,相较于组合模型2,组合模型3在没有牺牲交通效率的情况下改善了交通的稳定性和同质性。

最后,我们强调一下协作在改善碰撞时间(Time to Collision, TTC)上的贡献,在文献[19]中,TTC定义为某辆车与其先行车间的距离与相对速度的比值。图8显示了模拟结果并表明DCLDF对交通流的TTC分布有正向作用。类似的,相较于从组合1到组合2,组合2到组合3对TTC的改进并不明显。总而言之,DCLDF能够潜在地改善交通安全性。

 

结论

本文工作勾勒出了基于V2V通信的协同换道决策在改善交通稳定性、同质性和有效性以及减少交通拥堵方面的潜力。提出的换道决策模型与MOBIL一致并且不需要额外的调参工作。因此,所有的参数继承于MOBIL。

然而,我们也发现,在两种情形下,相较于从组合1到组合2,从组合2到组合3在交通效率方面的改善并不明显,这两种情形为:带入口匝道的高速公路段与不带入口匝道的高速公路段。因此,我们的分散协同换道决策模型仍需改进。由于本文的工作关注于为分散协同换道决策模型开发一个通用的框架,框架中使用的协同车辆跟驰模型相对简单。可以通过整合进更多精细的协同车辆跟驰模型来改善我们提出的换道决策框架的性能。本文忽略了通信延迟或传感错误,它们将在未来的工作中予以考虑。此外,如果换道执行过程没有立刻被考虑,它可能对交通流同质性有不同的影响。未来,也需要通过协同装备的车队搜集野外数据,来设计相关的控制策略并验证这些新技术的重要性。

                                                                                      

 

 

转载于:https://www.cnblogs.com/AnnHan/p/6889183.html

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值