LAformer: Trajectory Prediction for Autonomous Driving with Lane-Aware Scene Constraints
这项工作发布于2024年的CVPR。
Abstract
现有的自动驾驶当中的轨迹预测方法大多都使用单阶段的预测模型,这些方法使用观测阶段得到的代理历史运动信息以及复杂的驾驶场景信息来对代理的未来轨迹进行预测。
然而,这些方法在遇到复杂交通限制时,通常表现不佳,比如在遇到十字交叉路口时。因此,本文提出了一种称为LAformer的方法,来解决上述问题。
LAformer使用基于注意力的时序密集型车道感知估计模块(an attention-based temporally dense lane-aware estimation module)来持续对代理运动动态与从高精地图当中提取到的场景信息进行对齐(to continuously estimate the likelihood of the alignment between motion dynamics and scene information extracted from an HD map)。
此外,与单阶段的预测模型不同,LAformer使用第一阶段预测得到的结果作为锚轨迹。LAformer进一步使用第二阶段的运动改进模块来对整个时域(包括观测时刻与未来预测时刻)的时序一致性进行对齐。
作者在nuScenes和Argoverse Motion Forecasting v1.1数据集上进行了大量的实验,实验结果表明,LAformer在多模态轨迹预测任务上具有较强的泛化能力。
LAformer本身是一项开源的工作,源代码可见原文相应的链接。
【从摘要不难看出,LAformer是一个关注于更高效的对高精地图当中的信息进行利用的方法,提出了“基于注意力的时序密集型车道感知估计模块”来进一步强调车道对代理未来运动的约束。此外,LAformer同样使用了双阶段的轨迹解码器,但是此处的第二阶段轨迹改进比QCNet要简单很多。】
Conclusion
本文提出了LAformer,它是一种端到端的基于注意力的轨迹预测模型,它将观测时刻的轨迹和高精地图作为输入,其输出是代理多模态的未来轨迹。
LAformer当中使用了基于Transformer的时序密集型车道感知模块,以及双阶段的运动改进模块,来进一步提升预测的精度。
LAformer在Argoverse v1.1以及nuScenes数据集上展现出了较强的泛化能力。此外,作者进行了大量地消融实验以及敏感度学习,验证了车道感知模块以及运动改进模块的有效性。