《Semi-Supervised Classification With Graph Convolutional Networks》阅读笔记

最新推荐文章于 2024-07-25 16:58:58 发布

斯曦巍峨

最新推荐文章于 2024-07-25 16:58:58 发布

阅读量599

点赞数

分类专栏： Graph Learning 文章标签： GNN 深度学习

本文链接：https://blog.csdn.net/qq_42103091/article/details/124583375

版权

Graph Learning 专栏收录该内容

26 篇文章 16 订阅

订阅专栏

论文地址：Semi-Supervised Classification with Graph Convolutional Networks

图半监督学习：指图上只有部分样本（节点）有标签，这些样本通过边进行标签传播以标记那些没有标签的样本。

文章主要贡献：作者基于谱图卷积的1阶近似提出了图卷积神经网络，该方法在大图上高效的完成图上的节点半监督分类任务。

理论基础：谱图卷积

注：作者文中使用的是无向图。

假设图信号为 $\in \mathbb{R}^{N}$ ，滤波器 $g_{\theta}=\operatorname{diag}(\theta)$ 由 $\theta$ 参数化，则图信号上的卷积可以定义为：
$g_{\theta} \star x=U g_{\theta} U^{\top} x \tag{1}$
其中 $U$ 是正则化的拉普拉斯矩阵的特征向量矩阵，图的拉普拉斯矩阵的正则化为：
$\begin{aligned} L & = D^{-1/2}(D - A)D^{-1/2} \\ & = I_N - D^{-1/2}AD^{-1/2} \end{aligned} \tag{2}$
其中 $D - A$ 为未正则化的拉普拉斯矩阵， $D$ 为图的度矩阵， $A$ 是图的邻接矩阵。无向图上的拉普拉斯矩阵是一个实对称半正定矩阵，基于此，图的拉普拉斯矩阵可以分解为：
$\Lambda U^{\top} \tag{3}$
其中 $\Lambda$ 是拉普拉斯矩阵的特征值组成的对角阵。 $L$ 的特征向量可以构成一个正交空间，即：
$U^T U = I \tag{4}$
基于上述介绍，公式（1）中的 $Ug_{\theta}$ 和 $U^Tx$ 可以看作将滤波器和图信号在正则化的图拉普拉斯矩阵的特征向量张成的特征空间中的投影。而 $g_\theta$ 可以看作 $L$ 的特征值的函数 $g_{\theta}(\Lambda)$ 。因此，图谱卷积即先将图信号和滤波器投影到图的谱域，然后进行卷积操作。

但是公式（1）的计算代价非常高，特征值分解的复杂度为 $O(N^3)$ 。因此一般都不会直接使用特征分解，而是对 $g_{\theta}(\Lambda)$ 进行估计，在本文中便是使用切比雪夫多项式来对其进行估计，即：
$g_{\theta^{\prime}} \star x \approx \sum_{k=0}^{K} \theta_{k}^{\prime} T_{k}(\tilde{L}) x \tag{5}$
其中 $\tilde{L}=\frac{2}{\lambda_{\max }} L-I_{N}$ （ $\lambda_{max}$ 表示 $L$ 最大的特征值）， $T_k(\hat{L})$ 代表切比雪夫多项式。

作者假设 $\lambda_{max} = 2, \theta = \theta'_{0} = - \theta'_{1}$ ，公式（5）可以简写为：
$\begin{aligned} g_{\theta^{\prime}} \star x &\approx \theta_{0}^{\prime} x+\theta_{1}^{\prime}\left(L-I_{N}\right) x \\ &=\theta_{0}^{\prime} x-\theta_{1}^{\prime} D^{-\frac{1}{2}} A D^{-\frac{1}{2}} x \\ &= \theta\left(I_{N}+D^{-\frac{1}{2}} A D^{-\frac{1}{2}}\right) x \end{aligned} \tag{6}$
此外，作者使用了一个renormalization trick： $I_{N}+D^{-\frac{1}{2}} A D^{-\frac{1}{2}} \rightarrow \tilde{D}^{-\frac{1}{2}} \tilde{A} \tilde{D}^{-\frac{1}{2}}$ ，其中 $\tilde{A}=A+I_{N}$ ， $\tilde{D}_{i i}=\sum_{j} \tilde{A}_{i j}$ 。将该定义泛化到矩阵模式，设图信号矩阵为 $\in \mathbb{R}^{N \times C}$ ，则滤波器在图信号 $X$ 的卷积为：
$Z=\tilde{D}^{-\frac{1}{2}} \tilde{A} \tilde{D}^{-\frac{1}{2}} X \Theta \tag{7}$

其中 $\Theta$ 表示滤波参数。

GCN模型

基于谱图卷积，作者设计了一个2层的GCN模型用于半监督节点分类任务，其形式化定义为：
$\text{softmax}(\hat{A} \text{ ReLU}(\hat{AXW^{(0)}})W^{(1)}) \tag{8}$
其中 $W^{(0)}$ 和 $W^{(1)}$ 分别表示第一层和第二层的权重参数。作者使用交叉熵损失函数来进行模型的优化。下图是2层GCN模型的可视化，以及在Cora数据集上隐藏层表示的t-SNE降维可视化结果。

gcn_model

实验部分

作者测评的数据集总结如下：

dataset

注：Label rate表示有标签的节点在图中的占比。

与其它模型的性能比较结果如下所示，从结果可以看出GCN的性能超过其它模型一截。

performance

结语

以上便是本文的全部内容，要是觉得不错的话，可以点个赞或关注一下博主，你们的支持是博主进步的不竭动力，当然要是有问题的话也敬请批评指正！！！

斯曦巍峨

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
《Semi-Supervised Classification With Graph Convolutional Networks》阅读笔记

论文地址：Semi-Supervised Classification with Graph Convolutional Networks图半监督学习：指图上只有部分样本（节点）有标签，这些样本通过边进行标签传播以标记那些没有标签的样本。文章主要贡献：作者基于谱图卷积的1阶近似提出了图卷积神经网络，该方法在大图上高效的完成图上的节点半监督分类任务。理论基础：谱图卷积注：作者文中使用的是无向图。假设图信号为x∈RNx \in \mathbb{R}^{N}x∈RN，滤波器 gθ=diag⁡(θ)g_{
复制链接

扫一扫