《HiVT: Hierarchical Vector Transformer for Multi-Agent Motion Prediction》论文阅读之HiVT

最新推荐文章于 2024-09-26 05:40:28 发布

山水之间2018

最新推荐文章于 2024-09-26 05:40:28 发布

阅读量2.5k

点赞数 3

分类专栏：无人驾驶 Paper Reading 文章标签： transformer 人工智能深度学习

本文链接：https://blog.csdn.net/gavinmiaoc/article/details/125581904

版权

无人驾驶同时被 2 个专栏收录

23 篇文章 74 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

Paper Reading

31 篇文章 5 订阅

订阅专栏

本文提出了一种名为HiVT的分层向量Transformer模型，用于快速准确的多智能体运动预测。HiVT通过局部编码器和全局交互模块，有效处理交通场景中的复杂交互，同时利用平移和旋转不变性降低计算成本。实验表明，HiVT在Argoverse基准上以较小的模型尺寸实现了先进的预测性能，并能进行快速的多智能体预测，解决了现有矢量化方法的局限性。

摘要由CSDN通过智能技术生成

摘要

准确预测周围交通参与者的未来运动对于自动驾驶车辆的安全至关重要。最近，矢量化方法由于能够捕捉交通场景中的复杂交互而在运动预测领域占据主导地位。然而，现有的方法忽略了问题的对称性并且受到昂贵的计算成本的影响，面临着在不牺牲预测性能的情况下进行实时多主体运动预测的挑战。为了应付这一挑战，我们提出了用于快速准确的多智能体运动预测的分层矢量Transformer（HiVT）。通过将问题分解为局部上下文提取和全局交互建模，我们的方法可以有效且高效地对场景中的大量参与者进行建模。同时，我们提出了平移不变的场景表示和旋转不变的空间学习模块，提取对场景的几何变换具有鲁棒性的特征，并使模型能够在单个前向传递中对多个智能体进行准确的预测。实验表明HiVT在Argoverse运动预测基准上以较小的模型尺寸实现了最先进的性能，并且可以进行快速的多智能体运动预测。