论文阅读3:《GCC: Graph Contrastive Coding for Graph Neural Network Pre-Training》

最新推荐文章于 2022-09-01 12:20:46 发布

better_zoe_chang

最新推荐文章于 2022-09-01 12:20:46 发布

阅读量1.4k

点赞数 3

文章标签：自然语言处理神经网络深度学习

本文链接：https://blog.csdn.net/better_zoe_chang/article/details/109705656

版权

KDD,2020

作者观点：类似于NLP中的word2vec，现有的图表示学习方法无法迁移，只能在特定的图结构上学习表示，因此图上的预训练模型被提出，学习好图的初始化结果可针对具体下游任务进行微调。

本文预训练策略：一言以蔽之就是，在不同的图之间进行对比表示学习。

即：对某一节点进行多次采样，如果采样来自同一个图的相同节点，则赋予较大的比重，从而得到较小的损失，反之亦然

举个例子，如下图所示：
在这里插入图片描述
上图中，红色节点的两个子图来自相同的图，作为对比学习的正例，而蓝色节点的子图来来自于其他的图，作为负例。

这里作者引用两篇对比学习的文章，在此列出来，方便后续深入学习。

《Representation learning with contrastive predictive coding》
本文作者使用对比学习方法来自于这篇文章：InfoNCE

基于Skip-gram的模型
一些受word2vec启发而产生的图embedding方法，例如LINE、DeepWalk、node2vec、metapath2vec，大多基于节点的相似特征，并且不能使用到样本以外的问题。而本文提出的GCC模型是基于结构相似性的，并且能在训练之外的图上进行迁移。
Pre-training GNN
在这篇文章之前，也有一些针对图的预训练文章，这些文章要么使用了图上节点或者边的属性，要么定义了训练任务。
本文的模型：1）不使用图标签；2）没有需要学习的特征任务。