Strategies For Pre-Training Graph Neural Networks

最新推荐文章于 2023-08-15 21:20:53 发布

slothfulxtx

最新推荐文章于 2023-08-15 21:20:53 发布

阅读量439

点赞数 1

分类专栏：图神经网络文章标签：深度学习

本文链接：https://blog.csdn.net/fnoi2014xtx/article/details/107066797

版权

图神经网络专栏收录该内容

15 篇文章 6 订阅

订阅专栏

Paper : STRATEGIES FOR PRE-TRAINING GRAPH NEURAL NETWORKS
Code : official

摘要

作者解决的问题是如何预训练一个GNN网络，保证预训练的结果在具体数据集中finetune不会negative transfer 的现象。作者在文中并没有细致的解释为什么GNN上进行transfer learning 会更难，这个可能需要翻一下该篇文章的引用paper。作者提出了两步的预训练策略，分别在节点层面和图层面进行预训练，保证GNN预训练过程中可以同时学到局部和全局的信息，最后通过实验证明作者提出的transfer learning 策略可以有效地改善模型的表现。

两个级别

在这里插入图片描述
作者认为，节点层面的预训练可以很好的区分局部不同子图形状的节点，但是对于节点编码来说不可组合，全图层面的预训练可以很好区分图的编码，但是节点层面的编码不能表示局部的语义信息，高质量的预训练需要结合两部分。因此作者采用了两步预训练的方式，节点级别的预训练和图级别的预训练。

节点级别预训练

作者提出了两种自监督式的预训练方法，Context Prediction 和 Attribute Masking

Context Prediction

Context Prediction 使用子图来预测周围的图结构，优化目标是预训练一个GNN可以将具有相近结构的节点映射到相似的特征编码上。

K-hop Neighbourhood：距离节点 v 至多 k 的所有节点构成的子图

Context Graph : 到节点 v 的距离在 r₁ ~ r₂ 之间所有的节点构成的多个图

Context Anchor Node : 取 r₁ < K ，所有到节点 v 的距离在 r₁ ~ K 之间的节点

在这里插入图片描述
作者使用辅助GNN来将context graphs 编码成一个固定长度的向量，步骤如下

使用context GNN 对每个context graph 进行编码，得到节点上的特征表示
对所有的context archor nodes 取平均，获得定长向量表示，设节点 $v$ 的context embedding 表示为 $c_v^G$

使用负采样的方式来联合学习主干网络和context GNN，Context Prediction 的学习目标是一个二分类结果，即当节点 $v$ 和 $v^{'}$ 属于同一个节点时

$\sigma((h_v^{(K)})^\text T c_{v'}^{G'}) = 1$

而负样本通过对任意图中随机节点的采样获得，正负样本比率为 1:1。

Attribute Masking

Attribute Masking 旨在通过学习分布在图结构上的节点/边属性的规律性来捕获领域知识。

Attribute Masking 预训练的工作原理如下：屏蔽节点/边属性，然后让GNN根据相邻结构预测这些属性。具体来说，通过用特殊的屏蔽指示符替换输入节点/边属性（例如分子图中的原子类型）来随机屏蔽它们。然后，我们应用GNN获得相应的节点/边编码表示。最后，在嵌入的顶部应用线性模型以预测被掩盖的节点/边属性。我们对非完全连接图进行操作，旨在捕获分布在不同图结构上的节点/边属性的规则性。

在这里插入图片描述

图级别预训练

图级别的预训练可以有两个方向，对整张图的编码/属性进行预训练，或是对图结构进行预训练。

SUPERVISED GRAPH-LEVEL PROPERTY PREDICTION

作者表示，仅简单地执行广泛的多任务图级别预训练可能无法提供可迁移的图级别表示形式。这是因为某些受监督的预训练任务可能与下游任务无关。甚至会损害下游任务的表现。一种解决方案是选择“真正相关的”有监督的预训练任务，并仅对那些任务进行预训练GNN。但是，由于选择相关任务需要大量的领域专业知识，并且需要针对不同的下游任务分别进行预培训，因此这种解决方案的成本非常高。

作者认为，多任务监督式预训练仅提供图级别监督；因此，从中创建图级嵌入的本地节点嵌入可能没有意义。由于许多不同的预训练任务可以更容易地在节点嵌入空间中相互干扰，因此这种无用的节点嵌入会加剧负迁移问题。因此，我们的预训练策略是在执行图级预训练之前，首先通过节点级预训练方法在单个节点级别上对GNN进行正则化。这种组合策略可以产生更多可迁移的图表示，并且可以在无需专家选择有监督的预训练任务的情况下稳健地提高下游性能。