Spatio-Temporal Graph Convolutional Networks A Deep Learning Framework for Traffic Forecasting

最新推荐文章于 2022-12-18 21:53:25 发布

wwj灬

最新推荐文章于 2022-12-18 21:53:25 发布

阅读量1k

点赞数 1

分类专栏：时空序列预测论文

本文链接：https://blog.csdn.net/qq_41451283/article/details/118992913

版权

时空序列预测论文专栏收录该内容

15 篇文章 11 订阅

订阅专栏

时空图卷积网络：一种用于交通预测的深度学习框架

1.文章概述

在交通领域的预测问题，先前模型在短期预测上能取得较好的效果，但是在中长期的的预测中效果并不太好。

作者在文中将传统的中长期预测方法分为两种：

动态建模：使用数学工具和物理知识，该方法需要复杂的编程和巨大的算力消耗，且模型中使用了很多不切实际的假设和简化。
数据驱动：ARIMA该方法基于数据是平稳的假设不符合交通领域的实际情况。

深度学习的方法：

使用CNN捕捉交通网格之间的相邻关系，同时使用RNN在时间维度上捕捉时间依赖。但是传统的卷积方法只能在网格上使用，于一些实际领域的情况不符。且RNN网络通过迭代训练会造成误差累积，且训练难度大。

文章使用方法:

为了充分利用空间信息，使用图建模交通网络
为了应对RNN固有的缺陷，文中通过在时间轴上使用卷积结构提取时间特征

2.文章模型

2.1 网络结构

请添加图片描述

整个网络由两个ST-Conv块和一个输出层组成，其中ST-Conv由两个Temporal Gated-conv和一个Spatial Grapa-Conv组成，分别用于提取时间和空间依赖

2.2 Graph CNNs for Extracting Spatial Features

（1）原始图卷积

原始的图卷积定义为： $\Theta *_{\mathcal{G}} x=\Theta(L) x=\Theta\left(U \Lambda U^{T}\right) x=U \Theta(\Lambda) U^{T} x$ ，该方法进行图卷积十分耗时主要有两个方面的原因:一个是因为特征矩阵相乘使时间复杂度为 $O(n^2)$ ,二就是特征分解也会耗费大量的时间。

（2）ChebNet

在后来的改进中，为了降低复杂度用首先对图卷积的核进行了限制，令 $\Theta(\Lambda)=\sum_{k=0}^{K-1}\theta_k\Lambda^k$ 这样就将卷积由原来的N(所有节点的数量)降为K，并使用切比雪夫展开对卷积核进行近似， $\Theta(\Lambda)=\sum_{k=0}^{K-1}\theta_k T_k(\tilde{\Lambda})$ ,其中 $\Lambda=2\Lambda/\lambda_{max}-I_n$ ( $\lambda_{max}$ 是拉普拉斯矩阵的最大特征值)。新的图卷积就可以定义为 $\Theta *_{\mathcal{G}} x=\Theta(L) x=\Theta\left(U \Lambda U^{T}\right) x=\sum_{k=0}^{K-1}\theta_k T_k(\tilde{L}) x$ ，其中 $T_k()$ 是切比雪夫多项式，其定义如下：
$\left\{\begin{array}{l} T_{0}(x)=1 \\ T_{1}(x)=x \\ T_{n+1}(x)=2 x T_{n}(x)-T_{n-1}(x) \end{array}\right.$
该做法主要有两个好处：

卷积核的参数从原先的n个减少到k个，从原先的全局卷积变为现在的局部卷积。
通过切比雪夫不等式的迭代方法降低了时间复杂度，也避免了特征分解的操作

（3）ChebNet的一维近似

文中使K-1=1，则原来的卷积简化为 $g_{\theta}(L) x \approx \theta_{0} x+\theta_{1}\left(L-I_{n}\right) x=\theta_{0} x-\theta_{1}\left(D^{-\frac{1}{2}} A D^{-\frac{1}{2}}\right) x$ ，令 $\theta=\theta_0=-\theta_1$ ,则原式简化为 $g_{\theta}(L) x \approx \theta(I_n+D^{-1/2}AD^{-1/2})x$ 此处由于 $I_n+D^{-1/2}AD^{-1/2}\in[0,2]$ ,采用重归一化， $I_n+D^{-1/2}AD^{-1/2}$ 转化为 $\tilde{D}^{-1/2}\tilde{A}\tilde{D}^{-1/2}$ ,其中 $\tilde{A}=A+I_n$ , $\tilde{D_{ii}}=\sum_j\tilde{A_{ij}}$ 。

2.3 Gated CNNs for Extracting Temporal Features

Temporal convolutional layer包含一个一维因果卷积和门控线性单元(GLU)。

1-D causal convolution

请添加图片描述

因果卷积

请添加图片描述

扩散卷积

gated linear units(GLU)

原始的GLU将输入分为两个部分，分别经过1D-conv之后一部分经过Sigmodi然后进行相乘。

请添加图片描述

参考资料

https://zhuanlan.zhihu.com/p/286445515

wwj灬

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Spatio-Temporal Graph Convolutional Networks A Deep Learning Framework for Traffic Forecasting

Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting1.文章概述在交通领域的预测问题，先前模型在短期预测上能取得较好的效果，但是在中长期的的预测中效果并不太好。作者在文中将传统的中长期预测方法分为两种：动态建模：使用数学工具和物理知识，该方法需要复杂的编程和巨大的算力消耗，且模型中使用了很多不切实际的假设和简化。数据驱动：ARIMA该方法基于数据是平稳的假设不
复制链接

扫一扫