非确定性算法_使用最坏情况提高基于MPC的避障算法对参数不确定性的鲁棒性

a8ab500c40835161deebc34fdacc4b37.png

编者按 : 避障问题是AGV行驶过程中的一个重点,尤其是在未知和非结构化的环境中,没有关于环境的先验知识以及准确的车辆模型参数,难以充分发挥车辆的性能。作者在以前工作中,提出了在未知和非结构化环境中基于非线性模型预测控制的AGV避障算法,车辆模型用于预测和优化未来的动作,通过同时控制纵向速度和转角实现避障动作,但是车辆模型非常依赖车辆以及轮胎参数。本文中重点研究参数不确定性对上述避障算法的影响,提出一种双重最坏情况公式,满足车辆高速避障两个安全要求:无碰撞和无车轮提升。采用基于场景的方法,提出两种最坏情况场景,用于检查各种情况与该场景相关约束的满足度,最小化了约束数量以确保鲁棒性,本文还量化了算法鲁棒性和任务完成性能之间的权衡。

本文摘自 Vehicle System Dynamics 

原文题目:

"Improving the robustness of an MPC-based obstacle avoidance algorithm to parametric uncertainty using worst-case scenarios"

原作者:

Jiechao Liu, Paramsothy Jayakumar, Jeffrey L. Stein & Tulga Ersal 

作者单位:

Department of Mechanical Engineering, University of Michigan, Ann Arbor, MI, USA

a8ab500c40835161deebc34fdacc4b37.png 摘要: 作者以前的工作重点是在未知和非结构化环境中的大型高速自主地面车辆中避障。这项工作提出了一种基于非线性模型预测控制的算法,同时优化了速度和转向命令。该算法可以利用车辆的动态极限尽可能快地将其导航到目标位置而不损害安全性。在该算法中,车辆的模型被显式地用于预测和优化未来的动作,但是在实践中,模型参数值并不准确。因此,本文评估了算法对参数不确定性的鲁棒性。在考虑参数不确定性分布24%的评估场景中,首次证明了在算法中使用标称参数值会导致安全问题。为了提高算法的鲁棒性,提出了一种新的双重最坏情况公式,同时满足高速避障的无碰撞和无车轮提升两种安全要求。对分层随机和最坏情况的仿真结果表明,双最坏情况公式使算法对所有测试的不确定性实现具有鲁棒性。本文还量化了鲁棒性和任务完成性能之间的权衡。

关键词: 自主地面车辆;碰撞避免;车辆动力学;模型预测控制;参数不确定性;鲁棒性

e94d9f5f093a79f581bc43c35445456a.gif

1

前言

自动地面车辆(AGV)不仅能有效减少事故和改善民用应用的机动性,而且在军事应用中也能提高人员安全和任务完成性能。实现AGV的全部潜力依赖于许多算法的开发和成功部署,包括避障。

障碍避免是指基于传感器测量和/或环境的先验地图生成控制命令以安全地围绕障碍物导航车辆的任务。在文献中已经针对不同的AGV平台和应用开发了许多避障算法,例如[1-8]。

与大多数先前的工作不同,本文感兴趣的背景是在未知和非结构化环境中的大型高速AGV中避免障碍。这种背景是由军事应用推动的,其中高速机动是安全和任务完成性能方面的关键需求。然而,对于高速大型车辆,避障操纵可以引起稳定性或操纵问题,例如过度的侧滑,车轮抬起或甚至翻车。请注意,术语“高速”用于地面机器人的操作速度,地面机器人的操作速度约为2米/秒 。特别是,如果速度高于5米/秒(11英里/小时),在这项工作中被认为是高速。超越这种速度,车辆动力学开始在车辆的机动性中发挥重要作用,将这些动态纳入路径规划是我们背景下的关键要求之一。为此,需要避障算法,该算法可以利用车辆动力学来最大化任务完成性能,同时保证AGV的安全性[9]。

具体而言,在这项工作中,平坦地形上的典型军用卡车被视为代表性的大型AGV。它的任务是尽可能安全地从初始位置移动到给定目标位置。因此,如果需要,希望AGV高速运行并接近其动态极限。环境是非结构化的,这意味着没有要遵循的通道或交通规则。另外,在初始位置和目标位置之间存在障碍。它们的位置,大小和形状是先验未知的,但是当它们处于平面光检测和测距(LIDAR)传感器的范围内时被检测到。

作者以前的工作考虑了这个问题,并描述了未知和非结构化环境中AGV的避障算法[10-12]。该算法基于非线性模型预测控制(MPC)公式。该算法的新颖之处在于其能够控制车辆以避免静止障碍物并尽可能快地导航到目标位置,同时考虑动态安全约束。参考纵向速度和转向控制命令被同时优化,而没有关于环境的先验知识并且没有要遵循的参考轨迹。在算法中,AGV的模型被显式地用于预测和优化未来的动作。该模型依赖于多个车辆和轮胎参数值。仿真结果表明,当MPC中使用的参数值为准确的时,该算法能够安全利用车辆在不同大小和数量的感测障碍物周围行驶时的动态极限[11]。

本文的目的是研究参数不确定性对上述避障算法的影响,提高算法的鲁棒性。[11]中使用的参数值被认为是准确的,但实际上,它们是不确定的。这种不确定性会影响避障算法的有效性和任务完成性能。更具体地说,参数不确定性表示参数的值是恒定但未知的。然而,参数值的概率分布或界限是先验已知的[13]。这种避障算法对参数不确定性的鲁棒性以及如何改进它是文献中尚未解决的研究问题。因此,它们是本文的重点。

文献[14-16]提出了许多方法来通过考虑鲁棒性或随机MPC公式中给定的不确定性分布来提高MPC算法的鲁棒性。这些方法已应用于自动驾驶和车辆主动安全[17]。也有处理一般加法不确定性的算法,可将其近似为加法不确定性应用于参数不确定性。这些算法分为以下三种通用方法:(i)基于开环最小 - 最大优化的方法,其中考虑了对所有可能的不确定性实现的约束的满足,例如[18];(ii)基于辅助控制器的方法,其中使用强制反馈控制动作来确保实际状态轨迹不会偏离超出指定界限的前馈轨迹,例如[19,20];(iii)基于情景的方法,通过在大量不确定性样本中对机会约束进行评估,将机会约束转化为确定性对应物,例如[21];在该方法中,场景表示不确定性分布的特定实现或样本。本文也采用了相同的术语。

来自前两种方法的大多数算法(分析鲁棒或随机MPC算法)仅限于线性系统和高斯分布。这种限制是为了便于在预测范围内传播不确定系统状态和/或计算不变管和辅助控制器增益。然而,作者以前的工作已经得出结论,模型非线性对于应用兴趣至关重要[10,12]。虽然模型非线性的迭代在线线性化是可能的[22],线性化模型只有在一个小的区域周围的参考状态和输入向量的线性化是良好的近似。因为不存在参考轨迹,为了避免在非结构化环境中避免障碍,找到最佳路径也是除了避开障碍物之外的任务的一部分。这需要相对较长的预测范围来实现在可能明显偏离“当前”方向的方向上成功导航[11]。因此,小区域假设可能不成立。

与前两个类别相比,基于场景的方法可以应用于任何类型的模型和不确定性分布,只要评估足够数量的随机样本即可。然而,主要缺点是问题规模随着不确定参数的数量和这些参数可能采用的值范围呈指数增长[23]。

除了考虑一般加性不确定性的文献外,一些研究工作特别关注参数不确定性。例如,Walton[13]将不确定参数视为优化变量。然后,她使用成本函数,将原始成本乘以参数范围内的概率密度函数,以说明不确定性。然而,该应用仅限于最优控制问题(OCP)的成本函数和动态模型约束中的参数不确定性,包括路径约束中的参数不确定性。Xiong[24]等人通过多项式混沌展开法将原始随机轨迹优化问题转换为扩展的高维状态空间中的等效确定性问题。可以使用此方法处理路径约束。但是,扩展确定性状态方程中的状态数ns 等于原始状态数nr,此外,状态扩展系数的总数是625c69ead77fb8afc9561fea9d7b37b6.pngn是未知参数的数量,np 是多项式混沌扩展的阶数[25]。该数字随着多项式阶数和位置参数的数量迅速增长。因此,由于大量参数,该方法不适用于本文的问题。因此,处理参数不确定性的现有方法不容易适用于我们感兴趣的问题,其包括非线性动力学模型,非线性路径约束和大量参数。

因此,本文提出了一种新的方法来提高避障算法对参数不确定性的鲁棒性。特别是,给出一种双重最坏情况公式,可以满足AGV中高速避障的两个安全要求:无碰撞和无车轮提升。与基于场景的方法类似,所提出的方法还使得MPC算法中的OCP公式中的约束在所有考虑的场景中都是安全的。但是,不考虑使用数百个随机生成的场景,而是仅考虑两个场景,这两个场景是与此工作中确定的两种类型的不安全场景相对应的两种最可能的最坏情况场景。此外,不是应用所有场景来检查所有约束,每种最可能的最坏情况仅用于检查与该场景相关的约束的满足度。这种改进有助于最小化改进的OCP策略中的约束数量以确保鲁棒性。结果表明,尽管不能保证参数不确定性分布的所有可能实现,由于最坏情况的非唯一性和本工作中使用的近似,所提出的公式提高了算法的鲁棒性。本文还量化了基于MPC的避障算法的鲁棒性和任务完成性能之间的权衡。

本文的其余部分安排如下。第2节概述了开发的基于MPC的避障算法,并列出了所有考虑参数的标称值和相关的不确定性水平。第3节介绍了对参数不确定性的鲁棒性评估结果。第4节介绍了通过考虑最坏情况来提高稳健性的新策略。第5节显示并讨论了模拟结果。结论见第6节。

 

2

基于MPC的避障算法

图1显示了AGV处于闭环状态的非线性MPC算法的示意图。在这个基于模拟的研究中,AGV使用14自由度(DoF)车辆动力学模型来表示[26]。在基于MPC的避障算法中,多相OCP被制定为在LIDAR传感器的检测范围内优化参考纵向速度和转向控制命令。该算法可以通过受到各种约束的平滑控制命令尽可能快地导航车辆,例如加速度限制,转向限制和安全操纵区域。

da72b68fc60d2b674cdf286007b8ad51.png

图1 基于MPC的避障算法的示意图

在MPC的每个步骤,建立并求解一个或多个多相OCP以同时优化转向角和参考速度曲线。一般形式的避障的最优控制问题的公式由公式(1)-(10)给出。

b67a54ff5c01600cf1615d8b28f5767c.png

cd7f0134c12c00b4f9989e88c08a7535.png

通过最小化等式(1)中指定的成本函数,受制于所有阶段的等式(2)-(8)中定义的约束,以及等式(9)-(10)中针对预测的初始点和结束点定义的约束,最佳状态轨迹37634b623f9dfd59660919149f95f420.png,最优控制轨迹5092d101e1b3790635ba9f3543d540d9.png,时间 包含从一个子区域到下一个子区域的转换,其中N是阶段的总数; 即给定序列中的子区域的数量。特别地,成本函数等式(1)包括两个部分,即终端成本和被积函数的积分成本。等式(2)是车辆动力学模型。等式(3)和(4)分别指定状态和控制变量的界限。等式(5)定义了动态安全约束,等式(6)规定了避免障碍物的位置约束。等式(7)和(8)分别确保状态变量的连续性和不同阶段之间的时间。等式(9)称为终端约束,它限制状态变量的初始值和最终值。等式(10)指定预测时间的范围,预测时间也是要优化的变量。该配方的详细说明见[ 11 ]由于篇幅考虑而在本文中省略。

AGV的模型包含在OCP公式中,以预测和优化其在预测范围内的行为。特别地,使用三个DoF单轨非线性车辆模型,其考虑纵向载荷传递和轮胎非线性[11]。Pacejka Magic Formula轮胎模型[27] 用于预测横向力作为相应轮胎垂直载荷和侧偏角的函数。在这项工作中,通过将所有四个轮胎上的载荷限制在总是高于正的最小阈值,直接考虑无轮提升要求。具有经验估计的载荷传递系数的方程用于通过考虑车辆的纵向和横向载荷传递来预测轮胎垂直载荷[28]。

表1总结了非线性MPC模型中使用的参数列表和相关的不确定性水平。假设不确定性分布是独立的,并且遵循给定上限和下限的均匀分布。特别地,假设质量和惯性项具有±10%的不确定性,重心(CoG)位置测量有±20%的不确定性,并且轮胎参数有±30%的不确定性。基于测量参数值的难度估计不确定性水平。通常,轮胎模型中使用的参数值比车辆参数更不确定,尤其是在非结构化环境中,其通常是越野的。与质量和惯性测量相比,车辆重心位置测量具有更大的不确定性,因为重心位置可以容易地移动。假设与两个轴之间的距离相关的不确定性LV ,和轮胎半径Rt可以忽略不计,因为它们可以轻松直接地测量。质量和惯性的不确定性范围可能包括由于燃料消耗引起的微小变化,但不考虑大的变化(例如由于额外的有效载荷)。以下部分中给出的结果基于参数标称值和不确定性水平的这些假设。当做出不同的假设时,特定的数值结果(例如,失效情景的百分比)可能不成立,但仍然可以应用相同的方法。

表1  MPC模型中使用的参数列表

e84de5bc56d121cc98f5e1dbc507696e.png

3

评估参数不确定性的鲁棒性

在我们之前的工作中,假设没有参数不确定性。因此,MPC模型中使用的参数值是表1中列出的标称值 。这些标称值也用于14DoF模型,然后用于证明避障算法在闭环模拟中的有效性

  • 2
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值