Autonomous automobile trajectory tracking for off-road driving翻译学习

Autonomous Automobile Trajectory Tracking for Off-Road Driving:Controller Design, Experimental Validation and Racing

摘要

本文提出了一种非线性控制律,用于汽车在快速变化的越野地形上实时自动跟踪轨迹。现有方法可能存在缺乏全局稳定性、缺乏跟踪稳定性或依赖光滑路面的问题,其中任何一种都可能导致车辆在自动驾驶越野中丢失。这项工作以一种新的方式处理汽车轨迹跟踪,通过考虑前轮(而不是车身)相对于所需轨迹的方向,实现系统的配置控制。利用动力学方程设计了转向控制律,证明了全局渐进稳定性。然后把这个控制律扩大到处理充气轮胎和伺服驱动方向盘的动力特性。为了控制车速,制动器和油门通过调节比例积分(PI)控制器驱动。整个控制系统只消耗计算机资源的一小部分,可以忽略不计。它是在大众途锐“Stanley”上实施的,斯坦福赛车队参加了2005年DARPA大挑战赛,这是一场132英里的自主越野比赛。Stanley的实验结果证明了控制器能够跟踪障碍物之间、陡峭和波浪形地形、穿过深坭坑和沿着悬崖边缘的轨迹,典型的均方根(RMS)横向误差低于0.1m。在2005年DARPA全国资格赛中,Stanely是40名参赛者中唯一没有撞到障碍物或者错过大门的车辆。而在2005 年 DARPA 大挑战赛中,史丹利的课程完成时间最快。

1.介绍

自动驾驶技术是一个快速发展的领域,学术界和工业界都对此感兴趣。驾驶控制系统设计的历史重点考虑了铺彻的均匀表面上的运动,从而产生了许多高性能系统。人们越来越关注使车辆也能够自动越野驾驶。在这样的地形上驾驶会带来额外的挑战。控制系统必须能够处理崎岖不平和弯曲的道路,以及快速变化的地形类型,例如石子、松散的沙子和泥坑–同时稳定地跟踪距离很近的危险之间的轨迹。车辆必须能够在没有干预的情况下从大干扰中恢复。本文通过提出一种汽车非线性控制律来解决这些挑战,以在快速变化的越野地形上实时自动跟踪轨迹。通过考虑前轮(而不是车身)相对于期望轨迹的方向,以一种新的方式处理汽车轨迹跟踪,从而实现系统的控制。利用运动学方程设计控制律,且全局渐进稳定性也被证明。然后它被增强以处理充气轮胎和伺服驱动方向盘的动态性能。为了控制车速,制动器和油门由比例积分(PI)控制器驱动。控制器消耗的计算机资源可以忽略不计。它是在大众途锐“Stanley”上实施的,斯坦福赛车队参加了2005年DARPA大挑战赛,这是一场132英里的自主越野比赛。使用这个控制器,Stanely在比赛中完成了最快的完成时间,平均时速19.1mph.数百英里的测试结果表明,控制器能够跟踪障碍物之间、陡峭和波浪形地形、穿过深坭坑和沿着悬崖边缘的轨迹,典型的均方根(RMS)横向误差低于0.1m。在Stanely上测试的最高速度是在土路上42mph,这是比赛所需的速度上限。Stanely在DARPA城市挑战赛中的继任者,一辆名为“Junior”的帕萨特,使用这个控制器在墨菲特球场以71mph的速度行驶。
对于道路上的汽车驾驶,许多研究人员使用具有线性化状态的自行车模型来设计考虑充气轮胎的轨迹跟踪控制器[1]。例如在[2]中,使用PID控制器对GMCJimmy进行控制,证明了线性化后的系统动力学鲁棒稳定。在实验中,它表现出高达25kph的紧密跟踪。在California PATH项目中,使用了线性控制器,并演示了最高78mph下的跟踪[3]。演示了在高速公路上自动驾驶7.6英里,达到60mph,使用磁标记进行跟踪。横向控制方法使用前瞻距离作为误差度量[4]。[5]中给出了使用前瞻距离的动机。[6]中也使用了前瞻距离,具有潜在的领域,以提供驾驶员辅助转向。在没有驾驶员干预的情况下,该转向辅助控制器比以前的系统在曲线上有更多的误差,但已经证明了该误差的边界[5]。它以高达50mph的速度进行了测试。尽管这些道路控制法已经达到了极好的准确性,但他们并不是为越野环境而设计的。车辆必须能够从可能违反基于线性化方法的假设的打扰中恢复。
最近有很多越野驾驶项目。NIST HMMWV以高达22mph的速度越野行驶,使用回旋轨迹来参数化预测控制器[7]。它在开环中跟踪结果轨迹[8]。该系统在一片长满树木的起伏草地上进行演示。跟踪误差随着速度的增加而增加,因此所需的与障碍物的间隙距离也随着速度增加。另一种流行的越野驾驶技术是使用PID控制器追逐目标点的控制器,以将前轮指向轨迹上的前方点。如果没有启发式函数,该控制器即使在中等速度下也不稳定,如[8]中所述。它可以修剪角落,并且具有较差的干扰性。该技术已成功应用,包括在2005年DARPA大挑战中的许多车辆上。这些控制器在狭窄的曲线和不可预测的横向误差中表现出较差的性能,如DARPA 2005年国家资格赛的结果所示。
本文首先介绍了用于控制器设计的两种车辆模型,运动学和动力学。接下来,推导轨迹跟踪控制规律。证明了运动学控制律的全局渐进稳定性。最后,给出了几个月的现场测试结果,以及数百英里越野驾驶的实验数据。

2.车辆模型

本节描述了用于模拟车辆运动的两种方案。第一个是运动学模型。它假设车辆的惯性可以忽略不计。这允许设计在该假设下全局稳定的控制器。这个假设对于低速行驶是有效的[9]。第二个是动力学模型,包括惯性效应:轮胎打滑和转向伺服驱动。这种更复杂但更准确的方案允许模拟调整调整和增强控制器以处理现实动态。

A.运动学模型

速度为v(t)的汽车的运动可以用导向轮横向误差e(t)以及这些车轮相对于要跟踪的最近轨迹段的角度来描述,(ψ(t)−δ (t)),如图2所示。
在这里插入图片描述
ψ(t) 是车辆相对于最近轨迹段的偏航角(航向),δ (t) 是前轮相对于车辆的角度。该参考系允许执行器直接作用于误差度量,产生并置的传感和控制。向前行驶时,导向轮为前轮,横道误差的导数为:
在这里插入图片描述
其中转向在机械上受限于 |δ (t)| < δ max . 偏航角的导数,偏航率,是:
在这里插入图片描述
ψ ˙ = v R , s i n ( σ ) = l R , l = a + b ; ( 由 单 车 模 型 几 何 关 系 得 出 ) \dot{\psi}=\frac{v}{R},sin(\sigma)=\frac{l}{R},l=a+b;(由单车模型几何关系得出) ψ˙=Rv,sin(σ)=Rl,l=a+b;
其中 a 和 b 分别是重心 (CG) 到前轮和后轮的距离。
请注意,对于反向驱动,后轮可以被视为导向轮,产生一个有用的参数化,将在第 III-A 节中讨论。

B.动力学模型

为了模拟车辆的非线性动态运动,考虑了轮胎打滑和转向伺服电机的影响。车辆的相关状态如图 3 所示。
在这里插入图片描述
前后轮胎组被建模为每个提供一个力 Fyf(t) 和Fyr(t),垂直于轮胎的滚动方向,并与它的局部速度之间的角度a(t) 成正比 向量及其前向。这是汽车的自行车模型[1],在计划驾驶的范围内,
在这里插入图片描述
Cy是轮胎对的轮胎刚度。 具有固定的纵向和横向速度,Ux(t) 和 Uy(t)。这个模型模拟了轮胎以提供力的速率变形的效果。运动的微分方程是:
在这里插入图片描述

其中 Fxf(t) 和 Fxr(t) 分别是前轮胎和后轮胎在滚动方向上提供的力分量。通过匹配实验和模拟结果,发现带有越野轮胎的途锐车的Cy值为 145 k N r a d \frac{kN}{rad} radkN,以准确预测运动。
方向盘无法立即跟上指令角度。而是存在延迟,这取决于转向柱的惯性、伺服系统和通信延迟。经验上认为是一阶模型:
在这里插入图片描述
结果表明,该方法能准确地模拟方向盘响应中的动力学方程。模拟的时间延迟t为0.4秒,这是基于实验的保守值。

追踪控制法

本节详细介绍横向和纵向控制规律。将车辆状态和命令轨迹作为输入,并以固定速率输出命令,Stanely为 20 Hz。使用GPS和惯性传感器的估计器可以提供车辆的状态。仅使用指令轨迹的一个子集:最靠近前轮胎的轨迹段的位置、方向、曲率和速度。

A.横向控制

该控制器在快速变化的、潜在的崎岖地形上提供由路径规划器确定的所需车辆路径的闭环跟踪,并对状态中的任何错误具有弹性。本节通过确定部分控制律,给定运动方程。然后,在运动学假设下证明了全局渐近稳定性。接下来,通过考虑动力学方程运动,增强控制律以提高真实系统的稳定性和跟踪能力。
通过方程式(1)和式(2),选择一个控制器,使所得到的微分方程在交叉误差为零时具有全局渐近稳定平衡,如定理1所示。
定理1:对于(1)(2)式给出的运动方程,利用转向控制律,
在这里插入图片描述
导致闭环系统在 e = 0 处具有全局渐近稳定平衡, v(t) > 0 和 0 < σ m a x < π 2 0<\sigma_{max}<\frac{\pi}{2} 0<σmax<2π
证明
使用转向控制律,方程(5),在 e 和 y 的相空间中有三个区域——输入饱和高、输入饱和低和标称控制,如图 4 所示。
在这里插入图片描述图4:使用转向控制律行驶的车辆相图,速度为 v = 10(m/s),增益为 k = 2.5(1/s),转弯极限为 δmax = 24°。红线标志着从饱和转向(顶线上方和底线下方)到两条线之间的正常控制的过渡。在饱和区域,ψ 单调地接近正常控制区域。在正常控制区域内,|e| 单调递减。

中心区域为标称控制区域。为了不失一般性,假设v(t)是常数。相空间区域边界为标称转向指令 ( ψ ( t ) + a r c t a n k e ( t ) v ( t ) ) (\psi(t)+arctan\frac{k e(t)}{v(t)}) (ψ(t)+arctanv(t)ke(t))在转向极限处,因此该边界方程作为e的函数为:
在这里插入图片描述
对于饱和低区,相空间轨迹和边界线关于饱和高区的原点反对称。因此,在不失一般性的前提下,考虑饱和对饱和高区域对公式(1)、(2)的影响,
在这里插入图片描述
由于该区域的δ max > 0, ψ ˙ < 0 \dot{\psi}<0 ψ˙<0,且为常数,所以ψ(t)随时间线性减小。在这个区域内,ψ≤π,因此在有限的时间内,该区域内的任何状态都将流入名义区域,边界如式(6)所示。
在名义区域,将(5)式代入运动方程(1)式,得到:
在这里插入图片描述
在标称区域内,ė的符号总是与e的符号相反,对于任意e(t), | ė(t)|∈[ke(t), v(t)]。因此,e(t)的收敛速度介于线性(速率v(t))和指数(速率k)之间。因此,该区域内不能包含任何轨道。由式(2)和(5)可知, ψ ˙ \dot{\psi} ψ˙的符号和与(ψ(t) + arctan k ∗ e ( t ) v ( t ) \frac{k*e(t)}{v(t)} v(t)ke(t) )相反,因此ψ(t) 接近arctan k ∗ e ( t ) v ( t ) \frac{k*e(t)}{v(t)} v(t)ke(t),收敛到 0。因此,原点是相空间中唯一的稳定平衡点。对于某些系数值,对于边界上足够大的 ∣ e ˙ ∣ |\dot{e} | e˙ ,状态可以从标称区域过渡到饱和区域。沿边界发生转换而不会发生颤振,因为状态时间导数在任何地方都是连续的,除了 ψ = ±π 处,它不与边界相交,因为 |ψ b (e)| < π ∀ e ∈ R,假设 0 < δmax < π 2 。任何流入饱和区域的状态都将在有限的时间内离开,如前所示。对于在时间 t1 过渡到饱和区域,必须证明当状态返回到标称区域时,在时间 t2,|e(t2)| < |e(t1)|。为了说明这一点,请注意,在该区域中,ė(t) 是 ψ(t) 关于 ψ = δ max 的反对称函数,ψ(t) 线性递减,当ψ(t) > δ max 时,ė(t) > 0。因此,任何从标称区域过渡到饱和高区域的状态都将在 ψ = δ max 处流向 e 的最大值,并返回到关于线 ψ = δ max 的相图中对称的路径。因为方程 (6) 定义的边界是关于 (ψ, e) = (δ max , 0)的 e 的单调递减的反对称函数,当状态流回该边界的名义区域时,在对称的 到其出发路径的路径,|e(t2)| < |e(t1)|。
总之,在饱和区域,状态在有限时间内转换到标称区域。如果状态从标称区域过渡到饱和区域,它会在有限时间内返回标称区域,|e(t)| 的值较低,边界上不会出现颤振。在标称区域,|e(t)| 以线性和指数之间的速率收敛到唯一的平衡点–原点。因此,原点是系统的全局渐近稳定平衡。
在较大的横向误差下,该控制律驱动车辆直线驶向轨迹。随着横向误差变小,方程(7)近似为 ė(t) = −ke(t),时域解 e(t) = exp (−kt)。因此,当车辆靠近轨迹时,它会以时间常数 k 指数方式收敛到轨迹。这是控制律中k乘以(1/v(t))的结果,类似[10]。当车辆朝向错误的方向时,转向命令是以 δmax 转向导致最短路径的方向再次指向前方。 在这些极端之间,arctan 函数可以实现平滑、稳定的过渡。
使用方程(5)中的控制器,前轮的位置被主动控制,但偏航不是。轮胎充当阻尼器,为横向速度提供反作用力。在低速下,这会稳定偏航动力学,但是这种反应的大小与速度成反比。随着速度的增加,阻尼效应减弱,因此需要主动阻尼。通过仿真和实验,发现偏航率的负反馈可提供最佳的主动阻尼,而不会影响跟踪性能。因此,将 k d , y a w ( r m e a s ( t ) − r t r a j ( t ) k_{d,yaw}(r_{meas}(t)-r_{traj}(t) kd,yaw(rmeas(t)rtraj(t)添加到转向命令中,其中 k d , y a w k_{d,yaw} kd,yaw是调节增益 r t r a j r_{traj} rtraj是轨迹的偏航率,而 r m e a s r_{meas} rmeas是测得的偏航率。
控制器命令转向伺服。 伺服中的时间延迟和超调会导致不稳定。防止这种情况的一种方法是将 k d , s t e e r ( δ m e a s ( i ) − δ m e a s ( i + 1 ) ) k_{d,steer}(δ_{ meas}(i) − δ_{meas}(i + 1)) kd,steer(δmeas(i)δmeas(i+1)) 添加到转向命令中,其中 δmeas 是转向角的离散时间测量值,i 为前一控制期的测量索引。这提供了软件方面的领先控制。$_{d,steer}的值被调整为足够大以抑制方向盘响应,但足够小以对性能的影响较小。
需要额外注意弯曲的道路。 汽车在弯道上向内指向,以通过前后轮胎产生横向加速度。控制器偏航设定点应为非零值。相对于恒定曲率路径,稳态偏航 ψss 可以使用方程 (3) 中的力和力矩之和找到,得到:
在这里插入图片描述
在这里插入图片描述
在模拟和实验中,在控制器中使用这个设定点不会影响稳定性,但确实将车辆正确地转向零横向误差。它不补偿轨迹曲率的瞬变。 以低速行驶的最后一项修改可防止增益项 k v ( t ) \frac{k}{v(t)} v(t)k 变得过大,以至于它对 e(t) 上的噪声过于敏感。调谐增益 k s o f t k_{soft} ksoft 被添加到分母上,允许在低速下灵活软控制。在实验中,发现 k s o f t = 1 m / s k_{soft}=1m/s ksoft=1m/s 是合适的。
补偿动力学的完整转向律为:
在这里插入图片描述
饱和度为±δmax。在 DARPA 大挑战赛之前和比赛中,该控制律在Stanely上进行了数百英里的数百英里测试,没有任何错误。运动学控制定律的增强补偿了推导方程 (5) 中未考虑的动力学,产生一个稳定且能够消除横向误差的控制器,最高测试速度 - Stanely在土路上 达到42 英里/小时和,Junior在铺装路面上达到71 英里/小时。通过使用后轮胎作为引导轮,并围绕 ψ(t) 闭合一个循环,可以使用相同的误差度量和概念来使车辆倒车;后轮胎的方向。 这是在Stanely上实施和测试的,最高可达 15 英里/小时的越野速度,产生与 [11] 相似的性能。

B.纵向控制

纵向控制器从轨迹规划器、安全速度建议和健康监测中接收速度请求。控制器使用这些速度中的最小值作为其设定值。它将制动缸压力和油门水平视为两个对立的单作用执行器,对汽车施加纵向力。实验表明,对于制动系统这几乎完全正确。发现这是对节气门系统的可接受的简化。控制器在离散控制迭代 i + 1 时计算单个比例积分 (PI) 误差度量,
在这里插入图片描述
v c v_c vc是期望速度。 k p , v 和 k i , v k_{p,v} 和 k_{i,v} kp,vki,v 的值决定了干扰抑制和超调之间的权衡。 积分项被饱和以防止饱和。
这种相反的、单作用的执行器系统可能容易受到颤振和死区的影响,如 [12] 中所述。在这里,使用了一种不同的方法,几乎没有建模假设 。当误差度量为正时,制动系统命令与 PI 误差度量成正比的制动缸压力,当它为负时,节气门水平设置为与 PI 误差度量的负值成正比。使用相图 [13] 的分析表明,该方法解决了抖动和死区问题。为了达到控制的制动压力,非线性滞后制动压力缸的控制输入是使用制动压力的饱和比例反馈来发出指令的。

4.实验结果

2005 年 2 月至 10 月期间使用所提供的控制器进行了数百英里的道路测试,使用大众途锐“Stanley”,一款 1.9 m 宽的 SUV,配备 0.25 m 宽的越野轮胎。典型的速度是 5 到 35 英里/小时。有关系统架构的详细信息,请参见 [14]。控制器在 Pentium-M 1.6 GHz 计算机上运行,消耗的资源可以忽略不计。对于大多数实验,如有必要,人类会在车辆中进行干预。最初的控制系统在 2005 年 3 月完成后,就没有导致任何干预。 几个测试类别的结果如下。 【1:此处省略了 Junior 的实验结果,因为它们是初步的,并且用于公路驾驶。 主要的初步结果是能够以高达 71 英里/小时的速度行驶而不会降低精度】

A.越野测试

一项测试在亚利桑那州的沙漠中进行。 赛道是一条碎石路,陡坡上有侵蚀。有关过程和结果,请参见图5。
在这里插入图片描述
图5:斯坦利从亚利桑那州沙漠中的一个测试过程中记录数据。 这条路是质量参差不齐的碎石。 中间陡峭、多风的部分展示了在具有大坡度和侵蚀的道路上的跟踪。 它包含了快速的直道和一条蜿蜒的道路,这条道路在陡峭的山坡上爬上爬下。横向误差的平均值为 0.003 m,标准偏差和 RMS 误差为 0.02 m。它包含一个以每小时 25 英里的速度转弯的障碍物。
另一项测试是在莫哈韦沙漠的 DARPA 2004 年大挑战赛中进行的。这些定性结果解决了几种情况。首先,在春雨之后遇到了水坑(深度≥ 0.1 m)。尽管它们导致了滑动,但控制器进行了补偿,最大横向误差为 0.2 至 0.5 m,具体取决于水坑深度、道路曲率和速度。水坑以每小时 15 英里的速度穿过,挡风玻璃被水覆盖,但在直线上保持低于 0.2 米的精度。在干燥条件下,正如预期的那样,由于轨迹角速率的变化,进出弯道的过渡会导致更高的横向轨迹误差,而轨迹的角速率并未前馈到控制器中。当车辆以 35 英里/小时的速度绕过障碍物时,强烈观察到这一点。尽管后轮滑出,但控制器仍使前轮与路面保持一致,并在适当的情况下反向转向。在测试中观察到的最严重的横向误差约为 1.5 m,这是由以 20 mph 的速度在砾石上的拐角处打滑造成的。

B.耐久测试

该实验是在大众汽车的亚利桑那试验场对车辆进行的耐力测试,在封闭的环形土路上,有障碍物。这条环路长 2.3 英里,重复 88 次,共计 200.1 英里的自动驾驶。平均横向误差为 0.02 m,RMS 横向误差和标准偏差为 0.08 m。 结果总结在图 6 中。
在这里插入图片描述

C.DARPA 大挑战沙漠赛

DARPA 大挑战赛包括在安大略赛道举行的“全国资格赛”(NQE),随后是“大挑战赛”(GCE),这是一场跨越内华达州沙漠和山脉的 132 英里比赛,起点和终点在内华达州普里姆 ,车辆中没有司机[15]。一辆装有 DARPA 官员的追踪卡车跟随每辆车,并带有远程终止开关。NQE 包含障碍物和模拟困难地形。 在一次特征运行中,如图 7 所示,平均横向误差为 0.01 m,RMS 误差和标准偏差为 0.05 m。
在这里插入图片描述
图7 .Stanley 记录来自 2005 年 DARPA 全国资格赛的数据。横向误差被放大到斯坦利绕过道路中间两辆停着的汽车转弯的时间,以及一个坦克陷阱,在每次机动时产生小的初始错误尖峰,在 轮胎宽度的顺序。
在 GCE 中,如图 8 所示,平均横向误差为 -0.06 m,标准偏差为 0.09 m,RMS 误差为 0.1 m。
在这里插入图片描述
图8.斯坦利记录了美国国防部高级研究计划局2005年大挑战的数据。这些位置是估计的车辆位置,交叉误差图被放大到比赛的关键路段,一个山口。
偏移量大于正常值的原因未知,但可能是转向角校准错误。偏移量仅为轮胎宽度的 1/5。Stanely在 6 小时 53 分 58 秒内完成了比赛,平均时速为 19.1 mph。最大行驶速度为 38.0 英里/小时。0.1 m RMS 误差小于轮胎宽度的一半,这表明能够以足够的精度自主遵循要求苛刻的越野路线,以安全地跟踪危险之间、障碍物周围和悬崖边缘的轨迹。

5.结论

提出了一种非线性控制律,用于汽车在快速变化的越野地形上实时自动跟踪轨迹,方法是控制前轮相对于所需轨迹的方向,从而实现系统的配置控制 .使用运动学方程证明了控制律的全局渐近稳定性。增强允许它处理动态的气压轮胎和伺服驱动的转向。速度控制器采用了比例积分(PI)控制器,旨在防止抖振。控制律消耗的计算资源可以忽略不计。实验结果表明,能够在各种越野设置、危险之间以及崎岖和弯曲的道路上准确跟踪轨迹,典型的 RMS 横向误差低于 0.1 m。Stanley 是唯一在 DARPA 国家资格赛期间没有撞到障碍物的车辆,并且在 2005 年 DARPA 大挑战赛中完成时间最快,在沙漠和山区的平均时速为 19.1 英里/小时。

参考文献

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值