节点规范化-Effective Training Strategies for Deep Graph Neural Networks

最新推荐文章于 2024-09-13 10:27:31 发布

JYHuahua

最新推荐文章于 2024-09-13 10:27:31 发布

阅读量739

点赞数 2

分类专栏：图卷积神经网络深度问题文章标签：深度学习神经网络

本文链接：https://blog.csdn.net/JYHlong/article/details/107612518

版权

本文深入探讨了深度GCN性能下降的原因，主要归咎于训练困难和过拟合，而非过平滑。作者提出节点规范化（NodeNorm）技术，通过节点自身的统计特性来规范化，有效减少特征相关性，增加模型平滑度，从而缓解过拟合和训练不稳定问题。实验表明NodeNorm在深层GNN中显著提高了性能。

摘要由CSDN通过智能技术生成

这篇文章主要指出，在先前的研究中，表明GNN性能随深度加深而下降的主要原因是过平滑。然而，本文作者分析得出，过平滑是一个重要的原因，主要原因是由于训练的困难和过拟合。训练的困难是由于梯度消失引起的，这可以通过引入残差连接来解决，但过拟合是训练深层GCN的主要障碍，他不能通过现有的规范法技巧来解决，同时，深层GCN会遭遇训练不稳定的问题，减缓训练过程。因此，本文提出了一种节点规范化技巧NodeNorm，它是在训练过程中使用节点自身的统计特性来对每个节点做规范化处理，这个方法通过阻止隐藏嵌入的逐特征相关性来规范化深层GCN，同时增加了模型的平滑度，从而有效减小了过拟合。
作者为了说明所提出方法NodeNormd的有效性，主要从以下几个方面进行论述：

1.为什么深层GCN会失败？
作者主要在GCN层中做了几个消融实验来检测GCN性能随深度下降的主要原因。一般的，一个 $l$ 层的GCN模型是由 $l$ 个前向传播的图卷积层组成的，被表示为：
$H^{\left ( l+1 \right )}=ReLU\left ( \hat{A} H^{\left ( l \right )}W^{\left ( l \right )}\right )$ ，其中 $\hat{A}=\tilde{D}^{-1/2}\tilde{A}\tilde{D}^{-1/2}$ ， $\tilde{A}=A+I$
根据该公式，一个GCN层是由两个步骤组成，传播步骤和转换步骤，即： $\bar{H}^{\left ( l \right )}=\hat{A}H^{\left ( l \right )}\left ( propagation \right )$