《HiVT: Hierarchical Vector Transformer for Multi-Agent Motion Prediction》论文精读

最新推荐文章于 2024-12-30 19:17:17 发布

xinwangAA

最新推荐文章于 2024-12-30 19:17:17 发布

阅读量2.4k

点赞数 29

分类专栏：轨迹/行为预测方向论文精读文章标签： transformer 深度学习人工智能自动驾驶 python 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aaqianrushi/article/details/137237781

版权

本文提出了一种新颖的方法HiVT，通过层次化的局部上下文提取和全局交互模型，解决多智能体运动预测中的对称性和计算效率问题。使用旋转不变的场景表示和局部参考帧间的几何关系，有效捕捉远程依赖，显著降低了计算复杂度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原文链接：Zhou_HiVT_Hierarchical_Vector_Transformer_for_Multi-Agent_Motion_Prediction_CVPR_2022_paper.pdf (thecvf.com)

论文源码：GitHub - ZikangZhou/HiVT: [CVPR 2022] HiVT: Hierarchical Vector Transformer for Multi-Agent Motion Prediction

摘要

现有的方法忽略了问题的对称性，并且计算成本昂贵

我们的方法通过将问题分解为局部上下文提取和全局交互建模

我们提出了平移不变的场景表示和旋转不变的空间学习模块

1.Introduction

痛点：常见的矢量化方法通常对参考系的平移和旋转不具有鲁棒性，为了解决这个问题，现有的研究将场景进行归一化，使其以目标代理为中心，并与目标代理的航向对齐，但随之而来的是计算成本的提高

解决方案：

在第一阶段，我们的框架避免了昂贵的全对全交互建模，并且只在局部提取上下文特征。

在第二阶段，为了补偿受限的局部接受域并捕获场景中的远程依赖，我们通过赋予Transformer编码器局部参考帧之间的几何关系，在以代理为中心的局部区域之间执行全局消息传递。

2.Related Work

略

3.Approach

3.1.Overall Framework

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。