《HiVT: Hierarchical Vector Transformer for Multi-Agent Motion Prediction》论文阅读之HiVT

本文提出了一种名为HiVT的分层向量Transformer模型,用于快速准确的多智能体运动预测。HiVT通过局部编码器和全局交互模块,有效处理交通场景中的复杂交互,同时利用平移和旋转不变性降低计算成本。实验表明,HiVT在Argoverse基准上以较小的模型尺寸实现了先进的预测性能,并能进行快速的多智能体预测,解决了现有矢量化方法的局限性。
摘要由CSDN通过智能技术生成

目录

摘要

1.介绍

2.相关工作

3.方法

3.1. 总体框架

3.2 场景表示 

3.3 分层向量Transformer

3.3.1 局部编码器

3.3.2 全局交互模块

3.3.3 多模态未来解码器

3.4  训练

4.实验

4.1 实验设置

4.2 消融研究 

4.3. 结果

5.结论


摘要

        准确预测周围交通参与者的未来运动对于自动驾驶车辆的安全至关重要。最近,矢量化方法由于能够捕捉交通场景中的复杂交互而在运动预测领域占据主导地位。然而,现有的方法忽略了问题的对称性并且受到昂贵的计算成本的影响,面临着在不牺牲预测性能的情况下进行实时多主体运动预测的挑战。为了应付这一挑战,我们提出了用于快速准确的多智能体运动预测的分层矢量Transformer(HiVT)。通过将问题分解为局部上下文提取和全局交互建模,我们的方法可以有效且高效地对场景中的大量参与者进行建模。同时,我们提出了平移不变的场景表示和旋转不变的空间学习模块,提取对场景的几何变换具有鲁棒性的特征,并使模型能够在单个前向传递中对多个智能体进行准确的预测。实验表明HiVT在Argoverse运动预测基准上以较小的模型尺寸实现了最先进的性能,并且可以进行快速的多智能体运动预测。

1.介绍

        以安全的方式在动态环境中导航是自动驾驶汽车的一项重要任务。为此,自动驾驶汽车需要了解周围环境并预测道路未来。然而,准确预测附近目标或意图可能未知的交通主体(比如车辆/自行年/行人)的未来运动具有挑战性。在多智体流量场景中,参与者的行为是由其他

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值