《HiVT: Hierarchical Vector Transformer for Multi-Agent Motion Prediction》论文阅读之HiVT

目录

摘要

1.介绍

2.相关工作

3.方法

3.1. 总体框架

3.2 场景表示 

3.3 分层向量Transformer

3.3.1 局部编码器

3.3.2 全局交互模块

3.3.3 多模态未来解码器

3.4  训练

4.实验

4.1 实验设置

4.2 消融研究 

4.3. 结果

5.结论


摘要

        准确预测周围交通参与者的未来运动对于自动驾驶车辆的安全至关重要。最近,矢量化方法由于能够捕捉交通场景中的复杂交互而在运动预测领域占据主导地位。然而,现有的方法忽略了问题的对称性并且受到昂贵的计算成本的影响,面临着在不牺牲预测性能的情况下进行实时多主体运动预测的挑战。为了应付这一挑战,我们提出了用于快速准确的多智能体运动预测的分层矢量Transformer(HiVT)。通过将问题分解为局部上下文提取和全局交互建模,我们的方法可以有效且高效地对场景中的大量参与者进行建模。同时,我们提出了平移不变的场景表示和旋转不变的空间学习模块,提取对场景的几何变换具有鲁棒性的特征,并使模型能够在单个前向传递中对多个智能体进行准确的预测。实验表明HiVT在Argoverse运动预测基准上以较小的模型尺寸实现了最先进的性能,并且可以进行快速的多智能体运动预测。

1.介绍

        以安全的方式在动态环境中导航是自动驾驶汽车的一项重要任务。为此,自动驾驶汽车需要了解周围环境并预测道路未来。然而,准确预测附近目标或意图可能未知的交通主体(比如车辆/自行年/行人)的未来运动具有挑战性。在多智体流量场景中,参与者的行为是由其他智能体的复杂交互决定的。这种交互进一步与依赖地图的交通规则交织在一起,使得理解场景中多智能体多样化的交通规则变得极其困难。

        最近,基于学习的方法已经证明了它们在运动预测任务中的有效性。受计算机视觉进展的启发,一些文章将场景栅格化为鸟瞰图像,并应用CNN进行预测。尽管这些方法很容易用现成的图像模型实现࿰

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HIVTHierarchical Vector Transformer for Multi-Agent Motion Prediction)是一种用于多智能体运动预测的分层向量变换器。该模型使用了向量变换器(Vector Transformer)的层级架构,用于对多智能体的运动轨迹进行预测。 HIVT模型旨在解决多智能体之间相互影响和合作的问题。在多智能体系统中,智能体之间的运动和行为往往会相互影响,因此准确预测智能体的运动轨迹变得非常重要。传统的方法往往难以捕捉到智能体之间的复杂相互作用和外部环境的影响,而HIVT模型通过分层向量变换器的架构,可以更好地捕捉到多智能体系统中的相互作用。 HIVT模型首先使用一个全局的向量变换器来处理整个多智能体系统的运动轨迹,以捕捉全局的趋势和相互作用。然后,对于每个智能体,模型使用一个局部的向量变换器来预测其个体的运动轨迹,以考虑个体特定的动态特征和周围智能体的影响。 通过分层向量变换器的架构,HIVT模型能够更好地处理多智能体系统中的动态变化和相互作用,提高了运动轨迹预测的准确性。同时,该模型还可以应用于多个领域,如智能交通、无人机团队协作等。 总而言之,HIVT模型是一种基于分层向量变换器的多智能体运动预测方法,通过捕捉多智能体系统中的相互作用和全局趋势,提高了运动轨迹预测的准确性和适用性。该模型在多个领域具有广泛的应用前景。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值