GCN（图卷积神经网络）详解

一去不复返的通信er

已于 2024-11-19 16:15:50 修改

阅读量6.0k

点赞数 41

分类专栏： AI天梯 # GNN架构文章标签：人工智能神经网络 GCN

于 2024-11-12 16:36:00 首次发布

本文链接：https://blog.csdn.net/qq_42980908/article/details/143639887

版权

1️⃣ GCN介绍

回忆一下，在我之前的博客已经介绍CNN架构（Alexnet，VGG，Unet，Resnet）和RNN。

CNN为处理图像等二维数据而设计，基于卷积操作实现特征的提取
RNN针对序列数据，通过循环结构和门机制捕捉序列中的依赖关系。

那为什么还要提出GCN呢？

实际上图像和序列数据都是欧式空间的数据，结构简单，使用CNN和RNN处理它们的时候需要保证输入格式是固定的 ①所有图像resize成固定大小，然后进行卷积操作得到特征 ②文本固定长度和词向量大小。然而，现实生活中有很多数据是没有固定结构的，其中一种就是图数据，比如社交网络，化学分子结构等。图数据结构不规则，CNN和RNN不好使了，研究人员在上世纪就开始研究如何处理这类数据，有很多方法，例如GNN、DeepWalk 和 node2vec 。而这篇文章介绍的图卷积神经网络是GNN中的一种技术。

图卷积神经网络(Graph Convolutional Networks, GCN)在2017年被提出，为了处理“图类型”的数据，GCN不要求输入格式固定。说白了，这个和网络CNN一样，都是用于提取特征，只不过提取的是图数据的特征。我们可以利用提取到的特征对图进行节点分类（node classification）、图分类（graph classification）、边预测（link prediction），还可以顺便得到图的嵌入表示（graph embedding）

注意哦，文本也可以表示成图的形式：
在这里插入图片描述

2️⃣ 原理

2.1 简述

GCN通过定义图卷积来处理图数据，现在分析一下图卷积的原理，看看它到底是个什么样子？

瞅瞅下面这个图，假设有一个图数据，咱先定义一些变量。

$A$ 表示图的邻接矩阵，表示的是节点之间的连接关系，要是节点相连，那元素就是1
图的度矩阵表示为 $D$ ，这东西图论学过，本质是一个对角矩阵，其中对角元素表示每个节点的度（度就是与该节点相连的边的数量）
$N$ 个节点，每个节点上有一个 $C$ 维的特征，因此所有节点的特征组成一个大小为 $N \times C$ 的特征矩阵 $X$ 。

GCN说白了就是对照CNN的卷积，定义了一个图卷积操作。CNN输入图像，图卷积的输入是前面定义的邻接矩阵 $A$ ，特征矩阵 $X$ ，咦，等等，为什么度矩阵 $D$ 不作为输入，因为 $D$ 可以通过A推导出来，所以就不输入了。咱先看看GCN的公式是啥：
$H^{(l+1)}=\sigma\Big(\tilde{D}^{-\frac{1}{2}}\tilde{A}\tilde{D}^{-\frac{1}{2}}H^{(l)}W^{(l)}\Big)$