GCNII《Simple and Deep Graph Convolutional Networks》阅读笔记

最新推荐文章于 2023-12-13 21:04:26 发布

智慧的旋风

最新推荐文章于 2023-12-13 21:04:26 发布

阅读量2.2k

点赞数 3

分类专栏：论文和书籍阅读（GNN）文章标签：深度学习图神经网络 GCNII GNN ResNet

本文链接：https://blog.csdn.net/weixin_41650348/article/details/114160430

版权

GCNII是为了解决GNN模型的过平滑问题而提出的，通过引入初始剩余连接和恒等映射，增强了深层图卷积网络的性能。文章介绍了过平滑现象的原因和相关解决方案，如skip-connection、JKNet和DropEdge，然后详细阐述了GCNII模型的结构和原理，以及在实验中取得的成果。GCNII的未来发展方向可能包括与注意力机制的结合。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

GCNII

Chen M, Wei Z, Huang Z, et al. Simple and deep graph convolutional networks[C]//International Conference on Machine Learning. PMLR, 2020: 1725-1735.

本文主要是针对GNN模型的过平滑（over-smooth）问题展开研究与讨论，回顾之前的一些解决方案，并且借鉴ResNet设计了GCNII模型。

过平滑问题以及其相关工作

其实到现在为止，大部分GNN模型都是浅层的，可以称得上深层模型的屈指可数——GCNII和DeeperGCN。之所以不能太深，是因为过平滑问题会导致性能下降。

所谓过平滑，就是指当我们堆叠多个图卷积层时，模型的性能不升反降的现象。至于为什么会这样，一种比较合理的解释是：这些模型都可以看作是一些滤波器，而这些滤波器所模拟的lazy随机游走会最终收敛到一个稳定的向量，因而导致了无法区分出不同的节点。并且，高度节点由于从邻居获得更多的信息，所以更容易出现过平滑问题。

而模型过浅，我们就无法从高阶邻居中提取信息了。

当然，从GNN刚兴起的时候大家就发现这个问题了，很多人都对此提出了各式各样的解决方案，其中一些思路对于我们自己设计model是很有帮助的。

第一类大方向是沿着ResNet中的剩余连接以及图的正则化等方法进行扩展和思考。

skip-connection。一般是把当前层的结果和上一层的结果进行连接/拼接，这样，既可以保留之前的运算结果，又可以加速模型在训练过程中的收敛速度。
JKNet。保存每一层的运算结果，最后统一对所有层的结果进行一个连接，可以减轻过平滑问题。
DropEdge。训练时随机丢弃途中的一些边，是一种图数据增强的方法。

第二类大方向是浅层模型中的深度传播方法。

SGC。
APPNP。
GDC。

第一类方法确实是模型深度有了小幅提升，但是无法更深，还是存在过平滑的问题；第二类方法根本就没有加深模型深度，只是每一层深度传播去聚合更多的信息，也失去了深层模型的非线性结构。

虽然如此，层数一多，仍然会有过平滑问题。

GCNII模型

GCNII（Graph Convolutional Network via Initial residual and Identity mapping），就是带有初始剩余连接和恒等映射的GCN。
PyG官方文档：GCN2Conv。
$\mathbf{X}^{\prime} = \left( (1 - \alpha) \mathbf{\hat{P}}\mathbf{X} + \alpha \mathbf{X^{(0)}}\right) \left( (1 - \beta) \mathbf{I} + \beta \mathbf{\Theta} \right)$

最低0.47元/天解锁文章