论文简介
滴滴出行发表在KDD 2020上的一篇论文,原文标题为:HetETA: Heterogeneous Information Network Embedding for Estimating Time of Arrival
摘要
预计到达时间(ETA)是智能交通中的一项关键任务,包括时空数据。很少有方法采用图结构对ETA进行建模,使用异质图结构的工作更少。本文介绍了一个名为HetETA框架利用异质图信息建模ETA任务。我们将道路图转化为一个多关系网络,并引入一个基于车辆轨迹的网络来共同考虑交通行为模式。并且采用了三个模块来分别建模近期、日、周的时间信息,每一个组件都包含时间卷积和图卷积,以学习ETA任务的时空异构信息表示。大量实验表明,本文提出的模型超过了现有的方法,说明了异构信息网络表示学习对于ETA任务的重要性。
前言
预计到达时间(ETA)是智能交通系统中的一项核心功能,用于测量车辆预计从出发地到达某个目的地时的行驶时间。已有的方法从以下方式建模ETA问题
本文的创新点:
- 首次使用异质图神经网络建模ETA任务;
- 设计了一个基于注意的具有快速局部谱滤波的图网络Het-ChebNet,在与边数成正比的空间需求下嵌入稀疏异构信息网络;
- 大量实验表明超过了现有的state of the art。
问题定义
本文将估计到达时间任务定义为时空网络嵌入问题,给定出发的查询
q
q
q,表示
t
q
t_q
tq时刻从出发地
o
q
o_q
oq到达目的地
d
q
d_q
dq经由路径
P
q
P_q
Pq,本文的目的是通过嵌入在时空网络中的历史数据估计行程时间
y
q
y_q
yq,
定义有向关系图:
其中
V
V
V是结点集合(如路段),
E
E
E是边集合,表示结点
v
i
v_i
vi到
v
j
v_j
vj的关系类型
r
k
r_k
rk,
X
t
X^t
Xt包括了路段的静态特征(如长度和宽度)和动态特征(如路段交通速度、流量)。存在以下难点:
- 复杂的异质结构信息难以表示和保存在低维空间中;
- 存在于路段和时间段之间的复杂关联。
算法框架
本文使用GNN来学习空间关联并提取道路网络和基于网络的车辆轨迹信息。提出的HetETA模型包括三个部分:门控时间CNN、Het-ChebNets、和FC融合模块。模型的输入数据为近期的、每日的、每周的道路和车辆轨迹的异质时空数据,
本文使用了CNN捕获了时间轴上的时间关联,GNN和CNN交替类似“三明治”结构,学习包括近期、日、周的时空异质信息,最后将三个时间的地位向量进行拼接,使用一个全连接层进行融合,得到预测路段的通行时间。
三个模块分布捕获近期、日、周的时间信息,最后一层的卷积神经网络用于将时间维度压缩至一维。
三者序列长度分别为:
近期代表当前的交通状态
日周期代表一天中的时段
周周期代表一周中的时段
所有的图节点和边相同,但节点上的特征是动态变化的
时间相关的门控CNN
与STGCN类似,采用使用门控因果卷积,用
L
k
×
1
×
C
i
n
L_k×1×C_{in}
Lk×1×Cin捕获序列上的时间信息(第二维度为什么是1?)
卷积定义,K1和K2是卷积和,大小为
graph convolution layer
它由两个Het chebnet组成
Het-ChebNet for Spatial Correlations.
异构切比雪夫网络用于时空关联。双填充图卷积层的结构,其中两个Het chebnet用于路网和车辆轨迹,车流网络所构建的异质图一定程度上缓解了道路网络的稀疏问题。
实验
在两个数据集上超过了state of the art
结论
首次使用异质图建模,将路段,车辆轨迹两种不同的数据建模,使用Het-ChebNet 进行融合。近期、日、周的数据划分以及时间卷积模块在之前的有类似的工作。(ASTGCN、STGCN)
感觉这篇文章异构图是怎么构建的说的不是很清楚,在Introduction说了一些,节点(road segment)数量多,边比较稀疏难以聚合邻近特征,因为道路之间有多种转向关系,所以增加几种边的关系有助于解决边稀疏,捕获语义关系,更好聚合邻居节点信息,两个图的节点就是路段是节点,然后道路网络中有多种转向关系,Groad就是一个异构图;另外还有一个基于车辆轨迹的图Gvehicle,是根据车辆轨迹隐式捕获交通模式(从一个节点去另个节点),然后放到两个带有注意力机制的HetChebNet进行空间特征提取。