STGCN流量预估模型论文解读
《Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting》,Bing Yu, Haoteng Yin, Zhanxing Zhu,Peking University, Beijing, China
背景
流量预估 traffic forecast for short-term (5∼30min), medium and long term (over 30min).
本文提出一个深度学习框架Spatio-Temporal graph convolutional network, 用图网络来建模交通网络,用卷积网络建模time axis. 这是第一次在交通研究中应用纯卷积结构从图结构时间序列中同时提取时空特征。
交通预测数据
这是经典的时间序列预测问题,用vt及其前M个时间点,预测v_t+1及其后H个时间点:
在这里,我们用graph来表示每一个v_t, 如下图
每一个v_t(即每一张图)表示一个时刻,包含n个顶点,模拟的是n个传感器的结果。每M张图构成一条数据
模型结构
模型结构:两层时空卷积块+输出层,其中,时空卷积块由 时域卷积块1 + 空域卷积块 + 时域卷积块2 组成
时域卷积块在每个时间步之间进行;空域卷积块在每个时间步内进行
时域卷积块
输入:
X
∈
R
M
∗
n
∗
C
i
X \in R^{M* n* C_i}
X∈RM∗n∗Ci, 文中
C
i
C_i
Ci设为了1
对于每一个节点来说,维度是
R
M
∗
C
i
R^{M*C_i}
RM∗Ci,
卷积的kernel维度是
K
∈
R
K
∗
2
C
o
K \in R^{K* 2C_o}
K∈RK∗2Co,
所以,一维卷积的输出维度是
R
(
M
−
K
+
1
)
∗
2
C
o
R^{(M-K+1)*2C_o}
R(M−K+1)∗2Co
P、Q is split in half with the same size of channels, 维度分别是
R
(
M
−
K
+
1
)
∗
C
o
R^{(M-K+1)*C_o}
R(M−K+1)∗Co, 再通过一个GLU激活层
对于一张完整的时空卷积图,输入是
X
∈
R
M
∗
n
∗
C
i
X \in R^{M* n* C_i}
X∈RM∗n∗Ci, 输出是
Y
∈
R
(
M
−
K
+
1
)
∗
C
0
Y \in R^{(M-K+1)* C_0}
Y∈R(M−K+1)∗C0
空域卷积块
切比雪夫图卷积公式:
解释:
L
~
=
2
L
λ
m
a
x
−
I
n
\tilde{L} = \frac{2L}{\lambda_{max}} - I_n
L~=λmax2L−In,
L
=
I
n
−
D
−
1
/
2
A
D
−
1
/
2
L = I_n - D^{-1/2}AD^{-1/2}
L=In−D−1/2AD−1/2, 是图的对称归一化laplacian矩阵
D
D
D为图的度矩阵,
A
A
A为图的邻接矩阵, we can further assume that
λ
m
a
x
≈
2
\lambda_{max} ≈ 2
λmax≈2
T
k
(
L
~
)
T_k(\tilde{L})
Tk(L~)是
k
k
k阶在scaled拉普拉斯量处求值的切比雪夫多项式, 即它取决于中心节点的最近的
k
t
h
k^{th}
kthorder 的邻居节点(邻居节点和中心节点的距离最大为K)
T
i
(
x
)
=
2
x
T
i
−
1
(
x
)
−
T
i
−
2
(
x
)
T_i(x) = 2xT_{i-1}(x) - T_{i-2}(x)
Ti(x)=2xTi−1(x)−Ti−2(x), 其中
T
0
=
1
,
T
1
=
x
T_0=1, T_1=x
T0=1,T1=x
θ \theta θ是多项式系数
假设,传播邻居层数
k
=
1
,
λ
m
a
x
=
2
k=1,\lambda_{max} =2
k=1,λmax=2, 可得
最终,带有C_i个channels的图卷积可以表示为:
输出
X
∈
R
M
∗
n
∗
C
i
X \in R^{M*n*C_i}
X∈RM∗n∗Ci, 输出
Y
∈
R
M
∗
n
∗
C
o
Y \in R^{M*n*C_o}
Y∈RM∗n∗Co
输出层
输出层 = 时域卷积层 + 全连接层
每经过一个时域卷积块,维度减少
K
−
1
K-1
K−1, 一共会经过四个,所以,输入输出层的维度是
R
M
−
4
(
K
−
1
)
∗
n
∗
C
o
R^{M-4(K-1)*n*C_o}
RM−4(K−1)∗n∗Co
我们将时域卷积层的kernel维度和input一样,这样可以将其映射到n*C_o上,就是最终的输出
全连接层
w
x
+
b
wx+b
wx+b,
w
∈
R
C
o
w \in R^{C_o}
w∈RCo, 最终
v
t
∈
R
n
v_t \in R^{n}
vt∈Rn
Ref
STGCN 是处理结构化时间序列的通用框架。它不仅能够解决交通网络建模和 预测问题,而且可以应用于更一般的时空序列学习任务。
时空卷积块结合了图卷积和门控时间卷积,能够提取出最有用的空间特征,并 连贯地捕捉到最基本的时间特征。
该模型完全由卷积结构组成,在输入端实现并行化,参数更少,训练速度更 快。更重要的是,这种经济架构允许模型以更高的效率处理大规模网络。