决策规划(五)---动态规划

笔记来自 B 站

1.路径决策

以 host(ego) 在 reference line 的投影为坐标原点,建立 frenet 坐标系
如何找到起始点:
为什么不能以当前车的起点作为规划的起点:
如下图所示,t-1 时刻规划计算出的 t 时刻车应该在绿色的点,但是因为控制不能非常完美的达到目标点所以导致在 t 时刻自车实际位置在红色的点,那么 t 时刻规划又要预测 t+1 时刻 ego 的位置,也就是橙色的线,最终导致规划出来的线都是割裂的
在这里插入图片描述
解决方法:
绿色的点为 t-1 预测的点,t 时刻 ego 的位置
在这里插入图片描述
判断 t-1 时刻与 t 时刻的真实值差别是否过大:
在这里插入图片描述
差别不大:
在这里插入图片描述
生成的轨迹:
如果使用方法 2 进行规划,绿色的点是 t-1 时刻预测的 ego 轨迹,红色是 t 时刻实际走的轨迹,粉色是将 ego 轨迹映射在 t-1 时刻预测的轨迹上,橙色是 t 时刻预测的 t+1 的轨迹。因为我们 t 时刻预测的轨迹都是基于上一个预测点的所以就避免了割断的现象
在这里插入图片描述

2.寻找最优路径标准

最优路径标准:平滑,与障碍物保持适当距离,贴近参考线,下图中这条粉色的线就没有贴近参考线
在这里插入图片描述
有障碍物的二次规划是非凸的,如下图所示,这个车有多重方法可以绕过这个树:
在这里插入图片描述
代价函数如下图所示,代价函数值最大的位置就是代价函数最大的地方:
在这里插入图片描述

2.1 撒点法

每隔一定的米数撒一些点,寻找每个点的最优路径,这个路径就叫粗径:
在这里插入图片描述
然后基于这些粗径进行第二次的规划,解出一条最优路径:
在这里插入图片描述
如何在离散空间上找到粗解:动态规划
如何在凸空间上优化出最终解:二次规划

3.动态规划

3.1 计算每个路径的代价函数

如何判断生成轨迹的质量,需要用到代价函数:
在这里插入图片描述
平滑代价解释:
s 代表弧长,期望弧长越平滑越小,但是对该期望求积分比较困难,所以就简化为每个离散点的积分
在这里插入图片描述
障碍物距离代价:
相当与对障碍物画了两个圈,外圈是 d1,内圈是 d2 ,当在 (0,d2) 范围内接近于无穷大
在这里插入图片描述
最终就可以求出每个起点终点的最短路径
在这里插入图片描述

3.2 找到最短路径

可以使用迪杰斯特拉算法求出图的最短路径,也可以使用动态规划的方式:
现在要计算出 P0 —> P12 or P22 or P32 哪种代价最小,笨方法是计算
P0–>P12,计算 P0—>P22。。。
但是动态规划可以先将 P0—>P11 ,P0—>P21 ,P0—>P31 的结果进行保存然后再计算计算后面的结果,这样就减去了一部分计算量
在这里插入图片描述

4.轻决策与轻决策

为什么不使用粗规划(动态规划)的结果作为最终结果:因为粗规划是使用离散撒点的方式找到最优路径,撒点的方式本身就不是最优解
动态规划是一种决策的手段,相当于找到一段凸空间,然后再从这个凸空间中进行二次规划找到最优路径
二次规划是一个五次多项式,约束可以写成下图:
在这里插入图片描述
动态规划与决策的关系
在这里插入图片描述

4.1 重决策

在这里插入图片描述
为什么人为给定的空间有可能是非凸空间:
下面的两个蓝色的框是障碍物,人为可能会规划的空间是非凸空间
在这里插入图片描述
重决策优点:
在这里插入图片描述

4.2 轻决策

在这里插入图片描述
轻决策缺点:
在这里插入图片描述

4.3 重决策与轻决策的应用

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值