这篇论文提出了一个使用GAN和Seq2Seq模型联合的方法来生成轨迹。同时,将生成的轨迹应用到实际的例子中,一个是路网更新,另一个是起始-目的地需求评估。
一、模型结构
模型分为三个部分,一个部分是使用DCGAN来生成位置信息;第二个部分是使用Seq2Seq模型来生成顺序信息;另一个部分是使用ANN来生成时间信息。
1.1 位置分布学习
使用DCGAN来生成新的位置。
作者使用一个2D的图像来表示位置分布。将地图划分为若干个方格,每个方格代表一个区域,其坐标表示为右上角点的坐标。
使用位置图像训练DCGAN以生成新的位置图像,然后使用Harris角点检测算法来检测位置。
1.2 顺序信息学习
作者使用地图匹配算法将位置匹配至最近的路段,这些路段有自己独特的ID编号。
训练Seq2Seq模型:
模型的输入为默认顺序的id(文中为递增),目标为实际旅行模式顺序的id。生成的时候,输入为DCGAN得到的位置,输出为最有可能的顺序序列。
1.3 时间戳
在这部分中,作者使用ANN推断轨迹的第一个时间戳,后续时间戳可根据 Δ t \Delta t Δt计算得到。
ANN的输入为轨迹的长度和匹配的第一个位置所在的路段,输出为首位置的时间(以15 second为单位划分一天)。
二、实验
2.1 评价指标
(1)宏观:位置分布。将一个地图看成一个向量,使用余弦相似度计算。
(2)微观:
1.位置到映射路段的距离;2.行驶距离;3.普通公路和高速公路的比例;4.轨迹覆盖区域。
2.2 Baseline
随机扰乱RP、高斯扰乱GP、TrajGen-v。
2.3 实验结果
(1)位置分布
(2)时间位置分布
每个小时的位置分布
(3)位置到匹配路段的距离
(4)旅行距离
(5)旅行覆盖距离
(6)普通公路和高速公路的比例
三、实例学习
3.1 路网更新
作者从地图抹去一些路段,然后从各数据集选取500个经过这些路段的轨迹,使用路网更新算法来生成路段,看哪个生成的和原来的相差最小。
3.2 起始-目的地需求分析
该实例的目标是计算OD矩阵的值,即预测两地之间的流量。使用余弦相似度计算和真实值之间的差距。
结果:
然后,作者还计算了每个小时的OD矩阵,来揭示生成轨迹的时空特征:
四、结论
(直接翻译原论文)我们提出了一种使用保留数据效用生成运动轨迹人工数据集的方法TrajGen。生成的移动轨迹与原始数据分离,可以在不存在隐私问题的情况下共享。TrajGen将移动数据中的空间信息与时间信息解耦。在真实出租车数据集上的实验结果表明,TrajGen生成的人工移动轨迹与原始数据符合相似的分布。路线图更新和OD出行需求预测的结果表明,TrajGen能够保留原始数据在机动性数据研究中的效用。