《HiVT: Hierarchical Vector Transformer for Multi-Agent Motion Prediction》论文阅读之HiVT

最新推荐文章于 2024-04-20 15:44:38 发布

山水之间2018

最新推荐文章于 2024-04-20 15:44:38 发布

阅读量2.4k

点赞数 3

分类专栏：无人驾驶 Paper Reading 文章标签： transformer 人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Gavinmiaoc/article/details/125581904

版权

无人驾驶同时被 2 个专栏收录

23 篇文章 74 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

31 篇文章 5 订阅

订阅专栏

目录

3.1. 总体框架

3.2 场景表示

3.3 分层向量Transformer

3.3.1 局部编码器

3.3.2 全局交互模块

3.3.3 多模态未来解码器

4.1 实验设置

4.2 消融研究

摘要

准确预测周围交通参与者的未来运动对于自动驾驶车辆的安全至关重要。最近，矢量化方法由于能够捕捉交通场景中的复杂交互而在运动预测领域占据主导地位。然而，现有的方法忽略了问题的对称性并且受到昂贵的计算成本的影响，面临着在不牺牲预测性能的情况下进行实时多主体运动预测的挑战。为了应付这一挑战，我们提出了用于快速准确的多智能体运动预测的分层矢量Transformer（HiVT）。通过将问题分解为局部上下文提取和全局交互建模，我们的方法可以有效且高效地对场景中的大量参与者进行建模。同时，我们提出了平移不变的场景表示和旋转不变的空间学习模块，提取对场景的几何变换具有鲁棒性的特征，并使模型能够在单个前向传递中对多个智能体进行准确的预测。实验表明HiVT在Argoverse运动预测基准上以较小的模型尺寸实现了最先进的性能，并且可以进行快速的多智能体运动预测。

1.介绍

以安全的方式在动态环境中导航是自动驾驶汽车的一项重要任务。为此，自动驾驶汽车需要了解周围环境并预测道路未来。然而，准确预测附近目标或意图可能未知的交通主体（比如车辆/自行年/行人）的未来运动具有挑战性。在多智体流量场景中，参与者的行为是由其他智能体的复杂交互决定的。这种交互进一步与依赖地图的交通规则交织在一起，使得理解场景中多智能体多样化的交通规则变得极其困难。

最近，基于学习的方法已经证明了它们在运动预测任务中的有效性。受计算机视觉进展的启发，一些文章将场景栅格化为鸟瞰图像，并应用CNN进行预测。尽管这些方法很容易用现成的图像模型实现࿰

了解本专栏

超级会员免费看

山水之间2018

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
《HiVT: Hierarchical Vector Transformer for Multi-Agent Motion Prediction》论文阅读之HiVT

目录摘要1.介绍2.相关工作3.方法3.1. 总体框架3.2 场景表示 3.3 分层向量Transformer3.3.1 局部编码器3.3.2 全局交互模块3.3.3 多模态未来解码器3.4 训练4.实验4.1 实验设置4.2 消融研究 4.3. 结果5.结论准确预测周围交通参与者的未来运动对于自动驾驶车辆的安全至关重要。最近，矢量化方法由于能够捕捉交通场景中的复杂交互而在运动预测领域占据主导地位。然而，现有的方法忽略了问题的对称性并且受到昂贵的计算成本的影响，面临着在不牺牲预测性能的情况
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。