第七课.有向图卷积网络

最新推荐文章于 2025-03-17 21:47:19 发布

tzc_fly

最新推荐文章于 2025-03-17 21:47:19 发布

阅读量8.9k

点赞数 10

分类专栏：图神经网络文章标签：人工智能神经网络机器学习

本文链接：https://blog.csdn.net/qq_40943760/article/details/115058946

版权

图神经网络专栏收录该内容

20 篇文章

订阅专栏

本文介绍了有向图卷积网络（DGCN），一种针对有向图数据设计的图神经网络模型。DGCN不仅考虑了一阶邻近关系，还引入了二阶邻近的概念，并据此定义了一阶邻近矩阵、二阶入度邻近矩阵和二阶出度邻近矩阵。通过对比实验，验证了DGCN在特征学习方面的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

有向图卷积网络简介

有向图卷积网络（Directed Graph Convolutional Network），简称DGCN，源于2020年的论文"Directed Graph Convolutional Network"；初次了解会给人一种感觉：这可能就是在GCN上的小修改，但其实背后暗藏重大创新，在2018年出现GCN前，我们就已经知道，Graph分为有向与无向，不管是什么样的图，总能用邻接矩阵表达，也能得到度矩阵，在该论文出现之前，我们其实完全可以认为用GCN就能胜任有向或无向图数据；但经过论文的描述，事实证明作者的想法确实有所道理；

比如现在有一个有向图：
fig1

首先可以看出，边具备方向，另外，边具有粗细，这是带有权重的边；如果简单思考，这应该可以用图注意力网络GAT来做，可以对边施加注意力；
回忆GraphSAGE中的一阶邻居，二阶邻居，现在要补充一个新概念：一阶邻近，二阶邻近；比如节点1和节点3称为一阶邻近，节点1和节点2称为二阶邻近（因为它们共享节点4，5，6）；所以论文认为，对于有向图，不应当只考虑邻居，还要考虑邻近；

从邻近研究，有以下图：
fig2
图a为原图，四个图中，以节点1作为主要研究对象，图b中节点4是节点1的一阶邻近，图c.i与图c.ii都是描述二阶邻近，对于图c.i，节点1和节点2是二阶邻近，对于图c.ii，节点1和节点3也是二阶邻近，但不同之处在于节点1和节点2称为二阶入度邻近，节点1和节点3称为二阶出度邻近；

Directed Graph Convolutional Network

针对有向图的一阶邻近表达，论文提出一阶邻近矩阵 $A_{F}$ ：
$A_{F}(i,j)=A^{sym}(i,j)$
其中， $A^{sym}$ 是邻接矩阵 $A$ 的对称形式，在有向图中， $A^{sym}(i,j)$ 元素取值规则为：

不存在一条边从节点 $v_{i}$ 到节点 $v_{j}$ ，或者从节点 $v_{j}$ 到节点 $v_{i}$ ，则 $A^{sym}(i,j)=0$ ；
只要存在一条边从节点 $v_{i}$ 到节点 $v_{j}$ ，或者从节点 $v_{j}$ 到节点 $v_{i}$ ，则 $A^{sym}(i,j)=1$ ；

注意：如果图是带权的，邻接矩阵 $A$ 的元素将不局限与0和1，所以 $A^{sym}$ 的值也不局限于0和1；

针对有向图的二阶邻近表达，论文提出了二阶入度邻近矩阵 $A_{S_{in}}$ ，和二阶出度邻近矩阵 $A_{S_{out}}$ ：
$A_{S_{in}}(i,j)=\sum_{k}\frac{A_{k,i}A_{k,j}}{\sum_{v}A_{k,v}},A_{S_{out}}(i,j)=\sum_{k}\frac{A_{i,k}A_{j,k}}{\sum_{v}A_{v,k}}$
其中， $A_{m,n}$ 表示原图邻接矩阵 $(m, n)$ 处的元素；

对有向图分别进行三种变换：
$Z_{F}=\widetilde{D}_{F}^{-\frac{1}{2}}\widetilde{A}_{F}\widetilde{D}_{F}^{-\frac{1}{2}}X\Theta$
$Z_{S_{in}}=\widetilde{D}_{S_{in}}^{-\frac{1}{2}}\widetilde{A}_{S_{in}}\widetilde{D}_{S_{in}}^{-\frac{1}{2}}X\Theta$
$Z_{S_{out}}=\widetilde{D}_{S_{out}}^{-\frac{1}{2}}\widetilde{A}_{S_{out}}\widetilde{D}_{S_{out}}^{-\frac{1}{2}}X\Theta$
其中， $\Theta$ 为基于参数{ $W, b$ }的线性变换操作（即GCN在没有激活函数下的表达形式），和GCN一样， $\widetilde{A}_{x}=A_{x}+\lambda I$ ， $\widetilde{D}_{x}=D_{x}+\lambda I$ ， $x\in\left\{F,S_{in},S_{out}\right\}$ ；

对于邻近矩阵 $A_{x}\in\mathbb{R}^{n\times n}$ 对应的度矩阵 $D_{x}$ ，其中 $x\in\left\{F,S_{in},S_{out}\right\}$ ，其计算规则为（与GCN中的度矩阵计算规则一样）：
$D_{x}(i,i)=\sum_{j}^{n}A_{x}(i,j)$

关于度矩阵的计算，不管是有向图，还是无向图，带权还是不带权，标准地，都可以通过邻接矩阵 $A\in\mathbb{R}^{n\times n}$ 得到度矩阵 $D$ ：
$D(i,i)=\sum_{j}^{n}A(i,j)$

Directed Graph Convolutional Network的架构为：
fig3

综上，有向图卷积层模型 $\widetilde{Y}=f(X,A)$ 为：
$\widetilde{Y}=Concat[ReLU(\widetilde{D}_{F}^{-\frac{1}{2}}\widetilde{A}_{F}\widetilde{D}_{F}^{-\frac{1}{2}}X\Theta^{(0)}),\alpha ReLU(\widetilde{D}_{S_{in}}^{-\frac{1}{2}}\widetilde{A}_{S_{in}}\widetilde{D}_{S_{in}}^{-\frac{1}{2}}X\Theta^{(0)}),\beta ReLU(\widetilde{D}_{S_{out}}^{-\frac{1}{2}}\widetilde{A}_{S_{out}}\widetilde{D}_{S_{out}}^{-\frac{1}{2}}X\Theta^{(0)})]$
其中， $\alpha$ 和 $\beta$ 是可学习的参数，如果考虑对其进行全连接变换，再用softmax输出类别概率，模型延伸为：
$\widehat{Y}=softmax(ReLU(\widetilde{Y}\Theta^{(1)}))$
论文在Cora-ML数据集上对GCN和DGCN的表现进行了可视化：
fig4
可视化的对象是单层图神经网络输出的特征，用非线性的降维方法将高维特征降维至二维，再将已知的节点类别标记成不同的颜色；