【论文】时空预测模型Spatio-Temporal Graph Convolutional Networks

STGCN流量预估模型论文解读

《Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting》,Bing Yu, Haoteng Yin, Zhanxing Zhu,Peking University, Beijing, China

背景

流量预估 traffic forecast for short-term (5∼30min), medium and long term (over 30min).
本文提出一个深度学习框架Spatio-Temporal graph convolutional network, 用图网络来建模交通网络,用卷积网络建模time axis. 这是第一次在交通研究中应用纯卷积结构从图结构时间序列中同时提取时空特征。

交通预测数据

这是经典的时间序列预测问题,用vt及其前M个时间点,预测v_t+1及其后H个时间点:
在这里插入图片描述
在这里,我们用graph来表示每一个v_t, 如下图
在这里插入图片描述
每一个v_t(即每一张图)表示一个时刻,包含n个顶点,模拟的是n个传感器的结果。每M张图构成一条数据

模型结构

在这里插入图片描述
模型结构:两层时空卷积块+输出层,其中,时空卷积块由 时域卷积块1 + 空域卷积块 + 时域卷积块2 组成

时域卷积块在每个时间步之间进行;空域卷积块在每个时间步内进行

时域卷积块

输入: X ∈ R M ∗ n ∗ C i X \in R^{M* n* C_i} XRMnCi, 文中 C i C_i Ci设为了1
对于每一个节点来说,维度是 R M ∗ C i R^{M*C_i} RMCi
卷积的kernel维度是 K ∈ R K ∗ 2 C o K \in R^{K* 2C_o} KRK2Co,
所以,一维卷积的输出维度是 R ( M − K + 1 ) ∗ 2 C o R^{(M-K+1)*2C_o} R(MK+1)2Co

P、Q is split in half with the same size of channels, 维度分别是 R ( M − K + 1 ) ∗ C o R^{(M-K+1)*C_o} R(MK+1)Co, 再通过一个GLU激活层
在这里插入图片描述
对于一张完整的时空卷积图,输入是 X ∈ R M ∗ n ∗ C i X \in R^{M* n* C_i} XRMnCi, 输出是 Y ∈ R ( M − K + 1 ) ∗ C 0 Y \in R^{(M-K+1)* C_0} YR(MK+1)C0

空域卷积块

切比雪夫图卷积公式:

在这里插入图片描述

解释:
L ~ = 2 L λ m a x − I n \tilde{L} = \frac{2L}{\lambda_{max}} - I_n L~=λmax2LIn,
L = I n − D − 1 / 2 A D − 1 / 2 L = I_n - D^{-1/2}AD^{-1/2} L=InD1/2AD1/2, 是图的对称归一化laplacian矩阵
D D D为图的度矩阵, A A A为图的邻接矩阵, we can further assume that λ m a x ≈ 2 \lambda_{max} ≈ 2 λmax2

T k ( L ~ ) T_k(\tilde{L}) Tk(L~) k k k阶在scaled拉普拉斯量处求值的切比雪夫多项式, 即它取决于中心节点的最近的 k t h k^{th} kthorder 的邻居节点(邻居节点和中心节点的距离最大为K)
T i ( x ) = 2 x T i − 1 ( x ) − T i − 2 ( x ) T_i(x) = 2xT_{i-1}(x) - T_{i-2}(x) Ti(x)=2xTi1(x)Ti2(x), 其中 T 0 = 1 , T 1 = x T_0=1, T_1=x T0=1,T1=x

θ \theta θ是多项式系数

假设,传播邻居层数 k = 1 , λ m a x = 2 k=1,\lambda_{max} =2 k=1λmax=2, 可得
在这里插入图片描述

最终,带有C_i个channels的图卷积可以表示为:
在这里插入图片描述
输出 X ∈ R M ∗ n ∗ C i X \in R^{M*n*C_i} XRMnCi, 输出 Y ∈ R M ∗ n ∗ C o Y \in R^{M*n*C_o} YRMnCo

输出层

输出层 = 时域卷积层 + 全连接层
每经过一个时域卷积块,维度减少 K − 1 K-1 K1, 一共会经过四个,所以,输入输出层的维度是 R M − 4 ( K − 1 ) ∗ n ∗ C o R^{M-4(K-1)*n*C_o} RM4(K1)nCo
我们将时域卷积层的kernel维度和input一样,这样可以将其映射到n*C_o上,就是最终的输出
全连接层 w x + b wx+b wx+b w ∈ R C o w \in R^{C_o} wRCo, 最终 v t ∈ R n v_t \in R^{n} vtRn

Ref

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
STGCN 是处理结构化时间序列的通用框架。它不仅能够解决交通网络建模和 预测问题,而且可以应用于更一般的时空序列学习任务。
时空卷积块结合了图卷积和门控时间卷积,能够提取出最有用的空间特征,并 连贯地捕捉到最基本的时间特征。
该模型完全由卷积结构组成,在输入端实现并行化,参数更少,训练速度更 快。更重要的是,这种经济架构允许模型以更高的效率处理大规模网络。

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值