论文笔记--Spatial-Temporal Fusion Graph Neural Networks for Traffic Flow Forecasting

最新推荐文章于 2024-06-06 18:30:02 发布

chenxino

最新推荐文章于 2024-06-06 18:30:02 发布

阅读量1.1k

点赞数 3

分类专栏：论文笔记文章标签：神经网络深度学习

本文链接：https://blog.csdn.net/weixin_42533527/article/details/120394325

版权

论文笔记专栏收录该内容

14 篇文章 6 订阅

订阅专栏

在交通预测问题上，现有的框架通常利用给定的空间邻接图和复杂的机制来建模空间和时间关联。作者认为使用给定的空间邻接图会限制模型的有效时空相关性学习，并且它们通常使用单独的模块来实现空间和时间相关性，或者只使用独立的组件来捕获局部或全局的异质依赖关系，割裂了时空依赖关系。为此作者提出一种时空融合图神经网络用于交通预测。提出一种数据驱动的“时间图”生成方法，以此来补偿空间图可能没有反映的相关性。提出一种新的交通预测方法。

交通预测中的挑战

以上图为例，距离远的节点可能具有一定的相关性，图（a）黄线表示现实中的空间邻接。如果从时间角度来看，在交通网络中扮演相同角色的区域，其交通可能具有相似的“时间模式”，以绿色虚线表示。在高峰时段，大部分靠近办公大楼的道路(从商业区)都会在同一时段遇到交通堵塞。但是目前的大部分方法都仅仅通过空间邻接情况来建模，忽略节点之间的时间相似性，缺乏对复杂时空相关性的图表示能力。

所以作者提出一种新的数据驱动的图构造方法：基于时间序列之间的相似性学习时间图。

还有就是现有的工作不能够很好的捕获局部和全局的空间依赖，通过RNN通过迭代捕获长序列依赖，耗时且存在梯度消失问题；堆叠CNN的方法（STResNet,STGCN，GraphWaveNet）随着堆叠层数增加可扩散因子增加可能会丢失局部信息，而且模型抗噪声能力太差。

基于此作者提出一种基于cnn时空融合图神经网络(STFGNN)捕获全局和局部信息。

问题定义

给定一个图，ASG表示空间邻接矩阵，给定T步历史观测情况，要学习到一个函数f，来预测未来T’时间步长的交通情况。

Method

主要框架如下图，主要有一个输入层，多个堆叠的时空融合层和一个输入层。输入层和输出层分别是一层和两层的带有激活函数的全连接层。而每一个时空融合层包括多个平行的STFGN模块和一个门控CNN模块。时空融合层将每个STFGN模块输出串联起来，加入门控CNN输出，成为下一层STFGN的输入。下面是各个模块具体情况。

STFGN模块

①时空融合图的构建

该模块提出了一个新的时空融合图。通过融合空间邻接图ASG，时间序相似性图ATG和自己前后时间情况信息获得的时间连接图ATC三个N×N矩阵得到一个比空间图更精确的节点依赖关系。

空间邻接图ASG

通过节点之间在实际空间上的距离获得。

时间序相似图ATG

在其中的时间序列相似信息作者采用了一种基于趋势的时间序列相似性计算方法（DTW），通过这种方式来获得两点之间时间序列之间的相关性。

具体计算方法如下

给定X = (x1, x2, · · · , xn)和Y = (y1, y2, · · · , ym)。获取序列的相似度。

首先需要计算Mc矩阵，公式如下

其中。最后相似度为。

显然上面的算法于动态规划方法是类似的。所以时间复杂度是O（n2）。为了减小时间复杂度，作者对DTW进行简化，限制它的搜索长度为T。即计算时不计算完整的Mc，特定位置设置为0。如下图，红色部分就是改进后的搜索区域。计算复杂度变为O（Tn）.

时间连接图ATC

对角矩阵，当节点的交通信息在短时间步不变，则对角元素为1，否则为0。表示同一节点之间在相邻时间步长之间的联系。

根据上述三个图及设置的K值，作者构建出一个时空融合图ASTFG，下图为K为3或4是构建的图。规则为ASG位于对角线上，ATG位于四个角上，ATC填补其他空。

②时空融合图神经网络模块

模块将数据进行切片划分输入多个平行的STFGN模块。每个模块输入K个时间步的观测信息。

而其中的图乘法模块的表达式如下：

其中A*就是上面计算出的时空融合图ASTFG，为可学习参数。其中运用到了LSTM / RNN中的门控机制，门控线性单元通过其非线性激活用于图乘法。中间的表示矩阵对应元素相乘，所以公式右边部分可以看作门控机制。

通过堆叠L个图乘法模块，可以聚合更复杂的非局部空间相关性。同时还将为每个块引入残差连接。然后通过MaxPooling操作将在每个隐藏状态h聚合得到。最后在进行裁剪取中间时间步数据作为输出。

门控卷积模块

尽管ASTFG可以通过ATG来提取全局时空相关性，但是它包含的相关性更多来自遥远的节点。而门控卷积模块可以来提取节点本身的时空相关性。

具体做法和GraphWaveNet是相同的，输入数据为，输出为，φ(·) 和 σ(·)是两种激活函数，θ1和θ2是两个独立的一维卷积运算，其膨胀速率为K -1。

最后模型损失函数选择Huber损失，计算方法如下

δ为控制灵敏度的超参数。

Experiments

数据集METR-LA和PEMS-BAY

实验设置

用一个小时12个连续时间步长历史数据用于预测下一个小时的12个连续时间步长数据。（5分钟一个时间步长），ATG 稀疏率0.01，时空融合图的K设置为4，δ的阈值参数为1。

性能比较

在两个数据集上大部分情况都取得较好效果。使用绝对百分比误差（MAPE），平均平均误差（MAE）和均方根误差（RMSE）的三个指标来评估所有方法。

消融实验

创新点

利用时间序列之间的相似性来构建节点之间的关系图

将多个图集组合成一个大的图结合网络获取潜在的时空依赖关系。

chenxino

关注

3
点赞
踩
13

收藏

觉得还不错? 一键收藏
打赏
0
评论
论文笔记--Spatial-Temporal Fusion Graph Neural Networks for Traffic Flow Forecasting

Summary在交通预测问题上，现有的框架通常利用给定的空间邻接图和复杂的机制来建模空间和时间关联。作者认为使用给定的空间邻接图会限制模型的有效时空相关性学习，并且它们通常使用单独的模块来实现空间和时间相关性，或者只使用独立的组件来捕获局部或全局的异质依赖关系，割裂了时空依赖关系。为此作者提出一种时空融合图神经网络用于交通预测。提出一种数据驱动的“时间图”生成方法，以此来补偿空间图可能没有反映的相关性。提出一种新的交通预测方法。Problem Definition交通预测中的挑战以上图为
复制链接

扫一扫