图森AI Day中有哪些亮眼的内容?详解图森决策规划方案!

作者 | 论文推土机  编辑 | 汽车人

原文链接:https://zhuanlan.zhihu.com/p/648278653

点击下方卡片,关注“自动驾驶之心”公众号

ADAS巨卷干货,即可获取

点击进入→自动驾驶之心【规划控制】技术交流群

本文只做学术分享,如有侵权,联系删文

今天有空快进看了下AI Day的决策规划方案,简单整理下。我对图森的印象还在几年前宫斗和破产风波上面,这几年能好好搞技术还整了一个有干货的AI Day已是不凡了。

基本思路

首先图森的基本方案是联合预测和规划的思路,就是说规划的时候,预测是能够考虑到自车的行为的,这个非常重要,因为在自车的不同规划轨迹下面,周围的环境肯定是不同的,所以预测结果必然不同,如果只是机械的用但一的预测模型给一个不考虑自车的结果,肯定不合理。最近我在这一块做了一些粗浅的学界方案研究,后续再做详细分享。我记得之前看过印象最深的是一个来自母校的文章,PiP: Planning-informed Trajectory Prediction for Autonomous Driving将的就是考虑自车规划的预测方法。

然后决策上面则是采用了博弈模型,前面的预测同学讲用的level-k博弈,不过没有人对他们怎么做的决策有详细介绍的,我们暂且默认就是level-k吧,level-k博弈模型下,根据自车的不同轨迹,博弈出其他车的意图概率,因为有level-k,所以可以产生多个目标不同激进程度的概率,然后在这个分布下进行contingency。然后上面说了,有多个自车的轨迹,所以每个轨迹下都会演化出对应的环境,现在就通过reward function来评估一下cost, 找到最好的自车策略,到这里还没结束,他们的优化目标是策略参数而不是控制策略本身,所以还有一道对策略参数进行全局优化的过程,得到自车最优的控制策略。

这里面我们可以看到,轨迹的优化是在参数空间上的,决策结果以及交互都能映射到参数空间上,说白了,优化这套参数空间就相当于把轨迹,决策,交互都搞了。这玩的什么套路呢?这里经图森的决策规划负责人,也就是讲这些东西的人的提醒,更正为“principle based, 即基于数学分析与建模的方法”,建立起策略参数和具体控制策略之间的联系。细节怎么做的完全没有,思路理解一下就行了。算法框架如下:

95c8d14ea8f59563c1a4efe6999356ed.png

contingency规划

现在我们还是回到规划方案上面,规划上用的contingency planning, 从而同时应对目标的多模态,仿真结果的展示上面效果还行。

8f5c9e235445df6dec68295805459ea2.png 9ca62fede908e935b848c8663cbcf926.png

如上图contingency能够同时考虑交互目标的多模态,在同时考虑目标的不同意图下做出自车的综合考虑下的最佳策略。不好意思,大疆很早以前就用了。

时空联合规划

时空联合优化确实不再被人为限制解空间,所以肯定比解耦方案要优越。图森的做法是先搞一个时空间联合采样,并且是在策略参数空间上的采样,给定策略参数,再给定车辆模型,得出对应的开环推演的轨迹:

16dd50570960563761407c2400476098.png

reward策略参数评估

说这个reward function肯定是高度非凸非光滑的,怎么整,有一个高端的全局优化器,具体是啥思路没有:

984d14714b106d33045df327472b486d.png

反馈控制

上面讲了用开环推演得到未来轨迹,最后得到的控制序列那肯定不够,不能直接提供控制,就算是高频刷新planning,也不保证稳定性,所以后面还有一个反馈控制。这就不多解释了,肯定得有反馈控制。这里还有一个在学学习模块。学的什么东西呢,就是planning中会低频更新策略参数。

94f528037a8b1c3e84af9c1522c2dafc.png

最后给了一个例子,把控制序列的优化和planning放在一起的好处就是planning的结果非常丝滑,且控制能够很好执行它:

42b6bbb3624c3c2567de82fa365c0a0c.png

最后贴出我的一位朋友秋痕的五个问题,我一个也回答不了哈哈:

9a551a0ddbb091d9c593bc40b07f0a4c.png

① 全网独家视频课程

BEV感知、毫米波雷达视觉融合、多传感器标定、多传感器融合、多模态3D目标检测、点云3D目标检测、目标跟踪、Occupancy、cuda与TensorRT模型部署、协同感知、语义分割、自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频(扫码学习)

6244ec3481815a8b32cdc544de7bae1c.png 视频官网:www.zdjszx.com

② 国内首个自动驾驶学习社区

近2000人的交流社区,涉及30+自动驾驶技术栈学习路线,想要了解更多自动驾驶感知(2D检测、分割、2D/3D车道线、BEV感知、3D目标检测、Occupancy、多传感器融合、多传感器标定、目标跟踪、光流估计)、自动驾驶定位建图(SLAM、高精地图、局部在线地图)、自动驾驶规划控制/轨迹预测等领域技术方案、AI模型部署落地实战、行业动态、岗位发布,欢迎扫描下方二维码,加入自动驾驶之心知识星球,这是一个真正有干货的地方,与领域大佬交流入门、学习、工作、跳槽上的各类难题,日常分享论文+代码+视频,期待交流!

2c5447f2af2a48759aa628fcc1553a52.png

③【自动驾驶之心】技术交流群

自动驾驶之心是首个自动驾驶开发者社区,聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、BEV感知、多模态感知、Occupancy、多传感器融合、transformer、大模型、点云处理、端到端自动驾驶、SLAM、光流估计、深度估计、轨迹预测、高精地图、NeRF、规划控制、模型部署落地、自动驾驶仿真测试、产品经理、硬件配置、AI求职交流等方向。扫码添加汽车人助理微信邀请入群,备注:学校/公司+方向+昵称(快速入群方式)

47135a54ac640ed8617644ff1e177e81.jpeg

④【自动驾驶之心】平台矩阵,欢迎联系我们!

95526e6ae663b622cdb54f5ff8107d95.jpeg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值