【Motion Forecasting】【摘要阅读】ProIn: Learning to Predict Trajectory Based on Progressive Interactions

ProIn: Learning to Predict Trajectory Based on Progressive Interactions for Autonomous Driving

这项工作发布于2024年,作者团队来自于北京科技大学。

Abstract

准确地对车辆周围的行人、非机动车以及其它车辆的未来行为进行预测,对于自动驾驶汽车是至关重要的。

大多数现有的工作通过与地图信息进行基于注意力的单阶段交互来捕捉地图信息,从而为代理之间的交互以及多模态的未来轨迹施加地图约束。然而,这些方法必须将地图规则编码到目标代理的特征当中,从而使得代理对所有可能的行驶路径有所感知,并且能够自适应地对交互有所感知。

在这项工作中,作者提出了一种渐进式交互的神经网络(a progressive interaction network),使得代理的特征可以渐进式地关注相应的地图信息,让模型可以更好地学习到与地图约束相关的代理特征表示。模型可以渐进式地将地图约束相应的复杂影响通过图神经网络编码到代理特征当中,通过在以下三个步骤来完成,分别是在历史轨迹编码器(historical trajectory encoder)、交互编码(social interaction)以及多模态分化(multi-modal differentiation)之后。
在这里插入图片描述
此外,本文方法还是用了一个权重分配策略,用于多模态的学习,使得每一个模式都有机会学习到Ground Truth的信息。

通过实验,作者验证了渐进式交互比现有的单阶段交互效果更好,并验证了模型当中每一个组件的有效性。本文方法在具有挑战性上的基准测试数据集上取得了较好的效果。

Contributions

  • 本文提出了一种渐进交互式的神经网络,使得代理可以渐进式地通过多阶段交互在不同的尺度上对地图信息进行获取;
  • 本文方法使用了一种权重分配策略,使得在训练期间,单一模式的Ground Truth对所有预测的多个模式均可见。

Conclusion

本文提出了一种渐进交互式的神经网络,来使得模型可以更好地对捕捉了场景上下文信息的代理特征表示进行学习。所提出的渐进交互神经网络可以渐进式地将地图信息融入到代理特征当中,通过三个阶段来完成(在历史轨迹编码器(historical trajectory encoder)、交互编码(social interaction)以及多模态分化(multi-modal differentiation)之后),从而将适应交互特征以及多模态预测的地图信息编码到代理特征当中,从而改进模型所编码的场景上下文信息。

大量的消融实验验证了本文所提出的渐进式交互的合理性。

实验结果表明,相较于LaneGCN,本文方法的性能在Argoverse 1和2数据集上均有巨大的提升。

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值