3 Methodology
3.1 Problem Formulation and Overview
作者提出了一种用于轨迹预测的从全局到本地的生成方法。首先,同时生成全局关键步骤t1、t9等,粒度为8。随后,中间步骤t5由t1和t9生成。再者,t3和t7分别由t1和t5、t5和t9生成。整个本地递归过程将持续进行,直到生成所有未来步骤。
Fig1: (a)像Graph- TERN这样先进的模型没有办法很好地将未来步长之间的约束表示出来,导致运动学上的预测不可行。(b)G2LTraj采用空间-时间约束来生成一致的轨迹。
3.2 Global Key Step Generation
1.interval:间隔
2.determine:确定
3.Multilayer-Perceptron:多层感知机MLP
4.Mean Square Error:均方误差MSE
5.Negative Log Likelihood Loss:负自然对数NLL
本节将一次生成智能体a等关键未来时间步长。确定关键步长的粒度L,即相邻两个关键步骤的相距时间。随后,确定关键步长必须要统一覆盖未来步长的长度。根据公式2可以生成N+1个关键步长。任何两个相邻关键步长都被认为是一个局部部分的头尾步骤。因此,可以将整个轨迹划分为n个部分,通过这个操作,可以保证累积误差不会在跨区域传播。
下一步,通过公式3预测Z(N+1)关键步骤的位置坐标。
根据Fig1显示,由于关键步骤都是同时生成,导致这些步长都缺乏相互约束,可能会导致运动学上的不可行预测。因此,通过调节他们的位置不同,引入这些关键步骤的空间约束。采用MSE是基于经验性能。
3.3 Local Recusive Generation
生成智能体a后,下一步是填充每一个本地部分的中间步骤。如果仅仅依靠头尾步骤去生成中间步骤,彼此之间的时间约束是脆弱的。
Fig(3):仅仅依靠t5和t9来限制模型获取历史运动学信息,可能会导致似是而非的运动学不可行t7,在红色椭圆圈显示。通过结合历史运动学信息,可以将预测范围缩小到运动学上可行的范围,如黑色椭圆形所示。
Experimental Setup
三个广泛使用的数据集:ETH、UCY、nuScenes
ETH和UCY包含了5个不同的真实世界场景,有1536个行人。使用留一法来训练和评估。对于ETH和UCY的任务是基于观测到的8个步长(3.2秒),预测未来12个步长,即4.8秒。
nuScenes是一个大尺度轨迹数据集,包含了车辆和行人。nuScenes的任务是通过给定的4个步长和高清HD地图来预测未来的12个步长。
基线预测机:SGCN、STGCNN、PECNet、AgentFormer、GraphTERN、DMRGCN for ETH&UCY、AutoBot for nuScenes
评价指标:ETH&UCY:average display error、final display error。
ADE:计算平均L2所有预测轨迹之间的距离坐标和相应的地面实值坐标的误差。
FDE:最终预测的目的地坐标和地面实况之间的误差。
使用best of K策略来计算最终ADE和FDE在k=20时的值。我们在k=10时评估nuScenes的结果。
fig4: 比较每一个未来步长的累积误差。累积误差5和10分别是每个未来步骤于地面实值L2距离的平均值,分别超过5个和10个最有可能的预测值。
fig5: UCY验证集上的定性结果。黑色椭圆形表示失败的情况。