通俗易懂的GCN原理讲解

听弧丶

已于 2022-10-28 22:06:29 修改

阅读量8.1k

点赞数 19

分类专栏：图神经网络文章标签：卷积神经网络神经网络

于 2022-10-17 16:04:28 首次发布

本文链接：https://blog.csdn.net/qq_50595984/article/details/127365520

版权

图神经网络专栏收录该内容

3 篇文章

订阅专栏

GCN，图卷积神经网络，实际上跟CNN的作用一样，就是一个特征提取器，只不过它的对象是图数据。GCN精妙地设计了一种从图数据中提取特征的方法，从而让我们可以使用这些特征去对图数据进行节点分类、图分类、边预测，还可以顺便得到图的嵌入表示（graph embedding），可见用途广泛。

为什么要使用GCN

深度学习一直都是被几大经典模型给统治着，如CNN、RNN等等，它们无论再CV还是NLP领域都取得了优异的效果，那这个GCN是怎么跑出来的？是因为我们发现了很多CNN、RNN无法解决或者效果不好的问题——图结构的数据。

图的结构一般来说是十分不规则的，可以认为是无限维的一种数据，所以它没有平移不变性。每一个节点的周围结构可能都是独一无二的，这种结构的数据，就让传统的CNN、RNN瞬间失效。这里涌现出了很多方法，例如GNN、DeepWalk、node2vec等等，GCN只是其中一种。

GCN公式

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rTg7kGNB-1665993567026)(C:\Users\龚剑波\AppData\Roaming\Typora\typora-user-images\image-20221017153810517.png)]$

这个公式中：

A波浪：=A+I，I是单位矩阵，代表领接矩阵
D波浪：是A波浪的度矩阵（degree matrix）
H：是每一层的特征，对于输入层的话，H就是X
σ：是非线性激活函数

这个公式看上去非常难理解，而且论文中的推导公式也用到了图拉普拉斯算子和切比雪夫多项式，这里我们就当看不见这个公式的推导过程，就好比我们得到了一个公式，可以基于图结构，从原始节点的特征中提取特征信息。

这样，通过若干层GCN，每个node的特征就从X变成了Z，但是无论中间有多少层，node之间的连接关系，即A，都是共享的。如下图所示：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SdE5EQR7-1665993567027)(C:\Users\龚剑波\Desktop\通俗易懂的GCN原理讲解.assets\image-20221017154152670.png)]$

GCN公式推导

推导比较长，如果想了解整体过程的话可以跳过这个部分~

这里参考了江南綿雨博客内容：

Step1: 求图模型的邻接矩阵和度矩阵

对于传统的GNN，一个图网络需要节点特征矩阵和邻接矩阵的输入，这样才能进行节点的聚合操作。但是GCN中还需要引入一个度矩阵，这个矩阵用来表示一个节点和多少个节点相关联，对于后面的步骤有巨大的作用，如图所示：在这里插入图片描述

Step2：进行特征计算
求得矩阵A , D , X A,D,XA,D,X后，进行特征的计算，来聚合邻居节点的信息。GCN中的聚合方式和传统GNN中的方式有较大差异，这里分解为几个细节点：

① 邻接矩阵的改变
邻接矩阵 A AA 没有考虑自身的加权，所以GCN中的邻接矩阵实际上等于 A AA ＋单位对角矩阵 I II。
在这里插入图片描述

② 度矩阵的改变
首先对度矩阵的行和列进行了归一化（具体格式看下图），为什么这么做呢？行归一化系数代表着节点自身的一个变化程度，关联的节点越少，系数越大，越容易随波主流，更易受别人影响。而列归一化系数，代表关联节点对当前节点的影响程度，关系网越复杂的节点，它对其他节点的作用就越小，比如我认识一个亿万富翁，但富翁认识很多人，我们也就是一面之缘，那么能说因为我和他认识，我就是个百万富翁了嘛，显然有点草率了。通过行和列归一化系数，相互制衡，秒不可言。

同时，归一化的系数还开了根号，就是因为考虑到归一化后的行和列系数都加权给了节点特征，均衡一点。
在这里插入图片描述