论文笔记：Graph WaveNet for Deep Spatial-Temporal Graph Modeling

UQI-LIUWJ

于 2023-01-31 22:50:18 发布

阅读量1.1k

点赞数 1

分类专栏：论文笔记文章标签：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40206371/article/details/128824298

版权

论文笔记专栏收录该内容

355 篇文章

订阅专栏

针对时空数据预测问题，GraphWaveNet模型通过自适应邻接矩阵建模节点间空间依赖关系，并利用空洞因果卷积捕捉时间依赖性。该模型不仅提高了预测准确性，还解决了传统模型中存在的迭代耗时和梯度不稳定等问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

IJCAI 2019

1 abstract & intro

时空数据挖掘问题大多数使用邻接矩阵来建模节点之间的属性关系，这种思路的一个基本假设是：节点信息取决于自身和邻居的历史信息。
- 但这类模型的假设存在着一些问题：
  - 未能充分建模节点之间的依赖关系
    - 两个节点之间没有连边，但是有依赖关系
    - 两个节点虽然是邻居节点，但是没有依赖关系
  - 未能有效学习到时间的依赖关系
    - RNN：迭代传播耗时（无法并行）、存在梯度爆炸/消失的问题
    - CNN：需要迭代很多层，才能得到较大的感受野
——>这篇论文提出graph Wavenet，使用自适应的邻接矩阵，在没有先验知识的情况下建模节点的空间依赖关系；同时使用扩散图卷积+空洞卷积，来解决第二个问题

2 问题定义

给定图G=(V,E)，其中节点集V，边集合E
- 邻接矩阵为 $\mathbf{A} \in \mathbf{R}^{N \times N}$
- 在某一时间步t，输入的节点信号矩阵是 $\mathbf{X}^{(\mathbf{t})} \in \mathbf{R}^{N \times D}$
这篇论文的目标和一般的时空数据预测类似，给定图G和过去S步的图信号数据，预测接下来T步的图信号 $\left[\mathbf{X}^{(t-S): t}, G\right] \stackrel{f}{\rightarrow} \mathbf{X}^{(t+1):(t+T)}$

3 模型部分

3.1 自适应扩散图卷积（空间依赖关系）

无向图的扩散图卷积
- - $P=A/rowsum(A)$ ，表示某个点转移到其他点的概率
有向图的扩散图卷积
- - $\mathbf{P}_f=\mathbf{A} / \text { rowsum }(\mathbf{A})$ ，表示某个点转移到其他节点的概率（正向扩散）
  - $\mathbf{P}_b=\mathbf{A}^{\mathbf{T}} / \operatorname{rowsum}\left(\mathbf{A}^{\mathbf{T}}\right)$ ，表示某个节点从其他节点转移过来的概率（反向扩散）
上面两个主要是DCRNN的思路【论文笔记：DCRNN （Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting）_UQI-LIUWJ的博客-CSDN博客】，本篇论文的highlight是首次引入了自适应图结构的概念，公式如下：
- - E1和E2是随机初始化的两个节点的embedding（以METR-LA为例，METR-LA有207个节点，代码里 E1 、E2维度分别均是（207,10）)
    - 分别表示每个点作为源节点和目标节点之间的空间依赖权重
  - 使用Relu消除自适应邻接矩阵中的弱连接
  - 使用Softmax归一化自适应邻接矩阵
- ——>可以将归一化的自适应邻接矩阵视为隐藏扩散过程的转换矩阵‘

结合预定义的空间依赖关系和自适应的隐藏空间依赖关系，就有了如下的图卷积
- $\mathbf{Z}=\sum_{k=0}^K [\mathbf{P}_f^k \mathbf{X} \mathbf{W}_{k 1}+\mathbf{P}_b^k \mathbf{X} \mathbf{W}_{k 2}+\tilde{\mathbf{A}}_{a p t}^k \mathbf{X} \mathbf{W}_{k 3}]$
如果事先没有预定义的空间依赖关系，那么只使用自适应图卷积
- $\mathbf{Z}=\sum_{k=0}^K \tilde{\mathbf{A}}_{a p t}^k \mathbf{X} \mathbf{W}_k$

3.2 时间卷积网络（时间依赖性）

使用空洞因果卷积 (dilated causal convolution)来捕获时间趋势

$\mathrm{x} \star \mathbf{f}(t)=\sum_{s=0}^{K-1} \mathrm{f}(s) \mathbf{x}(t-d \times s)$

3.2.1 门控TCN

$\mathbf{h}=g\left(\boldsymbol{\Theta}_1 \star \mathcal{X}+\mathbf{b}\right) \odot \sigma\left(\boldsymbol{\Theta}_2 \star \mathcal{X}+\mathbf{c}\right)$

3.3 整体模型

4 实验部分

4.1 不同模型对比

4.2 不同邻接矩阵构造方式对比

4.3 自适应邻接矩阵可视化

论文比较了9号节点和47号节点，通过左图可以发现，9号节点这一列有值的要多一些：9号节点和更多的其他节点有影响：通过右图可以发现，确实9号节点在交叉口，47号节点就“偏远”了很多

4.4 预测结果可视化

graph wavenet和真实值更贴切一些

4.5 计算时间

Training的话，Graph WaveNet需要多训练两个embedding E1和E2，所以会稍微慢一些
但是在inference阶段，graph wave是使用空洞卷积来进行预测的，可以一次性预测很多个未来的时间片；而DCRNN和STGCN都是使用RNN的，需要一个一个时间片迭代，故Graph WaveNet会快一些

博客等级

码龄8年

1596
原创

5611
点赞

1万+
收藏

3561
粉丝

关注

私信

热门文章

分类专栏

最新评论

论文笔记：Universal Value Function Approximators
Venus-ww: 算法1，看上去只是用强化学习框架来收集样本来更新UVFA用的，如何用于强化学习呢，比如，如何和DQN结合呢？
论文笔记：Deep Learning for Trajectory Data Management and Mining: A Survey and Beyond
qq418674358: 博主，请问下，我想找一个模型进行gps轨迹分类，用来区分是电瓶车的gps轨迹，还是汽车的gps轨迹，有什么可以直接用的模型吗，多谢了
数据集：深圳ETC数据（OD数据、轨迹数据）
是个例外: 你好，Description for Urban Data Release V2的数据集可以分享一下吗，我下载不了。
强化学习笔记：Sarsa算法
weixin_43831645: 虽然这是个老帖子了，但是也许还会有新人来看，所以还是想简单分享一下。SARSA更新用的是5元组(s, a, r, s', a')，其中s'是当前状态s执行动作a后到达的新状态。a'是基于当前策略实际会选择的下一动作（例如epsilon-greedy下的某个动作）。假设我们把这些元组存入replay buffer。当我们的策略发生变化后，如果我们从replay buffer中抽取一条旧的数据(s, a, r, s', a')来做更新，用y=r+gama*Q_target(s', a')来估计当前策略下的期望，那么这个a'实际上是过去某个旧策略下采取的动作，可能会与当前策略会采取的动作不同。在这种情况下，就会引入策略不一致的偏差，使得这个TD target与当前策略的真实期望之间产生误差。由于SARSA是on-policy算法，它要求更新时用的动作a'来自当前策略，这解释了为什么SARSA通常不适合与replay buffer一起使用。
数据集笔记：PEMS-BAY
2501_91380729: 这个是属于交通速度预测的数据集吗

大家在看

最新文章

2025

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UQI-LIUWJ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。