港科技&大疆:基于自适应交互模态探索的预测与决策

作者 | 自动驾驶专栏  编辑 | 自动驾驶专栏

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

>>点击进入→自动驾驶之心端到端自动驾驶技术交流群

本文只做学术分享,如有侵权,联系删文

c152b9e44f440452b7786976ff87ec7d.png

  • 论文链接:https://arxiv.org/pdf/2408.13742

  • 代码链接:https://github.com/HKUST-Aerial-Robotics/MIND

f30307e7f0df1f24688bce2625e5d00c.jpeg

摘要

eeace17ac33708d820e6ec733a1d1188.png

本文介绍了基于自适应交互模态探索的多模态集成的预测与决策。由于多模态交互的复杂性,在拥堵且动态的环境中导航给自动驾驶系统带来了重大挑战,其中各种交通参与者和自动驾驶车辆的行为是复杂的,并且是隐式耦合的。本文提出了一种新的框架,即多模态集成的预测与决策(MIND),其通过高效地生成涵盖多种不同交互模态的联合预测和决策来解决这些挑战。具体而言,MIND利用基于学习的场景预测来获得具有社会一致性交互模态的集成预测和决策,并且利用模态感知动态分支机制来生成场景树,该场景树高效地捕获不同交互模态的演变,其在规划范围内交互不确定性的变化较小。交互不确定性下的应急规划无缝地利用场景树来获得明确且考虑多模态演变的行为。基于现实世界驾驶数据集的闭环仿真中的综合实验结果表明,本文方法在各种驾驶环境下的性能优于其它强大的基线。

daa9e097dfb6f036b250836596e09e45.jpeg

主要贡献

e438b88b92f2a8c7ba2ccd67b101fe2c.png

本文的贡献总结如下:

1)本文设计了一种场景预测网络,并且将其与具有动态分支机制的树搜索技术相结合,从而获得覆盖范围更广的场景树,用于探索世界的演变;

2)对于场景树中的多种潜在未来变化,本文利用应急规划来自然地生成针对从根开始的每个分支的最优轨迹树,从而确定最佳决策;

3)本文通过各种实验评估MIND,结果表明,在不同的驾驶场景中优于其它基线,展现了其在复杂情况下的有效性。

96496b762038a6157ce1258866752f91.jpeg

论文图片和表格

216b8981975d0daa2d973b22863c0b4c.png

f3d6bbfbc73bca0e03fe675fc142f640.png

1aeb8228b50dd0815902885cf6e7f36a.png

9c0ae1514ecf6da5208e165ea9709f9f.png

b3a2c8d1b5fb9eb8c30e5f10c8749323.png

114394f90d2991a7e5fdd1032bc389e2.png

01e957443d9f09957637b69bf8c42f65.png

f549d9a59695432f3ac0c660ebe11a82.png

66ef06b3895abc37ec291eea252d8865.png

16298b9db4209172bd882ce844a5d042.png

e8136e39162a0b90d753d602d3ddea14.png

743c5f2693927d1ddee7c91ede87e172.png

d5a83e21726430bfc11601be22f3e2a7.png

e9e35920e0594b38e0ca9cd1e1552814.png

b53bd73a2fe177016fd88fa474f43aad.jpeg

总结

75999c1eade5839e8d9104b98d73cf39.png

本文引入了MIND框架,其作为动态交互环境中实现自动驾驶同时预测与决策的综合方法。该框架系统性地结合了场景预测网络、自适应交互模态探索机制和应急规划,以在处理多模态未来演变的同时,在复杂交互场景中生成合理的行为。与最新技术的广泛定量比较以及定性实验证明了本文方法的优越性。展望未来,本文旨在将所提出的框架扩展到现实世界应用中。

投稿作者为『自动驾驶之心知识星球』特邀嘉宾,欢迎加入交流!重磅,自动驾驶之心科研论文辅导来啦,申博、CCF系列、SCI、EI、毕业论文、比赛辅导等多个方向,欢迎联系我们!

dbbf6e69beb3144d550688433583af14.jpeg

① 全网独家视频课程

BEV感知、BEV模型部署、BEV目标跟踪、毫米波雷达视觉融合多传感器标定多传感器融合多模态3D目标检测车道线检测轨迹预测在线高精地图世界模型点云3D目标检测目标跟踪Occupancy、cuda与TensorRT模型部署大模型与自动驾驶Nerf语义分割自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频(扫码即可学习

7c5b31954e59c82758c403e4ee926e66.png

网页端官网:www.zdjszx.com

② 国内首个自动驾驶学习社区

国内最大最专业,近3000人的交流社区,已得到大多数自动驾驶公司的认可!涉及30+自动驾驶技术栈学习路线,从0到一带你入门自动驾驶感知2D/3D检测、语义分割、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪)、自动驾驶定位建图SLAM、高精地图、局部在线地图)、自动驾驶规划控制/轨迹预测等领域技术方案大模型、端到端等,更有行业动态和岗位发布!欢迎扫描下方二维码,加入自动驾驶之心知识星球,这是一个真正有干货的地方,与领域大佬交流入门、学习、工作、跳槽上的各类难题,日常分享论文+代码+视频

3ab787a8db70901333ca73859e3fb81f.png

③【自动驾驶之心】技术交流群

自动驾驶之心是首个自动驾驶开发者社区,聚焦感知、定位、融合、规控、标定、端到端、仿真、产品经理、自动驾驶开发、自动标注与数据闭环多个方向,目前近60+技术交流群,欢迎加入!扫码添加汽车人助理微信邀请入群,备注:学校/公司+方向+昵称(快速入群方式)

e15cf9b99f05a9faa6bcf6a89f3a5843.jpeg

④【自动驾驶之心】全平台矩阵

b2af3addaf294a25a9ae2e533ae56d88.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值