Apollo-规划技术4*

最新推荐文章于 2023-07-27 15:49:42 发布

肖浩然

最新推荐文章于 2023-07-27 15:49:42 发布

阅读量112

点赞数

分类专栏：无人驾驶学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiao769507610/article/details/118877301

版权

无人驾驶学习笔记专栏收录该内容

32 篇文章 10 订阅

订阅专栏

EM（Expectation-Maximum）算法也称期望最大化算法，迭代分为两步：期望步（E步）+极大步（M步）

算法流程：初始化分布参数+重复迭代直到收敛

无人车有三类约束：

Rraffic Regulation
Decisions
Best Trajectory

硬限制+软限制。前者比如交通规则

如果换道生成的策略的trajectory比不换道生成的策略的trajectory要好，那么就换道。
在这里插入图片描述

EM迭代过程：

生成一条Optimal path
在该path上对所有障碍物进行投影
然后生成一个optimal speed profile，在下一个周期该speed profile会送到path optimization
不断path / speed迭代，直至收敛到最优解

该算法的缺点：贪心算法，收敛到局部最优（但也够用）

分四步走：两步E两步M
在这里插入图片描述
优化问题的核心分三部分：

想要解决好决策问题，需要理解下面三个圆圈
在这里插入图片描述

rule based（规则）
optimization（优化）
path driven（数据闭环）

先了解清楚这个问题，才去通过大量的数据训练

（下图是老师推荐的课）
在这里插入图片描述

handling uncertainty with model

寻找一个action能够优化反馈函数（优化方式：RL）

RL：
能够给出状态到动作的映射
将见过的题做总结，并且知道了什么类型的题用什么方法或者套路去完成。
思考点：当环境发生剧烈变化，是否还能应对？

图意：看到老虎应该如何行动（往左往右还是直接进他嘴里）
在这里插入图片描述

imitation learning：模仿学习

RL最关心的问题：如何做这个映射

在这里插入图片描述
数据驱动：经过对大量案例的分析，形成模型。当遇到相似问题的时候，可以直接套用数据驱动的模型获得结果，十分快速。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Apollo-规划技术4*

EM（Expectation-Maximum）算法也称期望最大化算法，迭代分为两步：期望步（E步）+极大步（M步）算法流程：初始化分布参数+重复迭代直到收敛无人车有三类约束：Rraffic RegulationDecisionsBest Trajectory硬限制+软限制。前者比如交通规则如果换道生成的策略的trajectory比不换道生成的策略的trajectory要好，那么就换道。EM迭代过程：生成一条Optimal path在该path上对所有障碍物进行投影然后生成一个
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。