Graph Contrastive Learning with Augmentations

tutoujiehegaosou

已于 2024-01-03 21:46:51 修改

阅读量1k

点赞数 17

分类专栏： Graph 文章标签：笔记

于 2023-12-26 16:12:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tutoujiehegaosou/article/details/135221224

版权

Graph 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

GraphCL学习笔记

Abstract

提出GNN对自监督学习和pre-training较少。本文提出了GraphCL框架，用于学习图的无监督表示。设计四种类型的数据增强，在不同的settings（learning rate，batch size，dropout参数）下，研究这四种增强对不同数据集的影响。

Introduction

大多数graph-level的任务场景，GNN都是在监督的情况下进行端到端的训练，对自监督预训练的探索很少。自监督通常用作产生梯度爆炸或消失的深层架构，大多数图数据集在大小上受到了限制，而且GNN通常是浅层架构以避免过度平滑。

然而，特定任务的数据集标签可能稀缺，且预训练是有前途的技术。

GNN需要预训练的原因：现实世界的图数据甚至基准数据集也变得越来越庞大，预训练也可以找到更好的参数。

对比学习旨在通过不同增强视图下最大化特征一致性来学习表示。

本文的贡献：

(1)设计了四种数据增强；

(2)提出了一种用于GNN预训练的图对比框架GraphCL；

(3)评估不同类型数据集上对比不同增强的性能，揭示性能的基本原理；

(4)GraphCL 在半监督学习、无监督表示学习和迁移学习的设置中实现了最先进的性能。它还增强了针对常见对抗性攻击的鲁棒性。

Methodology

Data Augmentation for Graphs

可能不存在像图像那样普遍合适的图像增强。

关注三类数据：生化分子、社交网络和super-pixel graphs

四种图数据增强

(1)Node dropping：随机丢弃部分节点及其连接，先验条件是缺失部分节点不会影响G的语义；

(2)Edge perturbation：随机添加或删除一定比例的边来扰乱G中的连通性，意味着G的语义对边缘连接具有一定鲁棒性；

(3)Atrribute masking：使用上下文信息恢复屏蔽的节点属性，假设是丢失部分节点属性不会对模型预测产生太大影响；

(4)Subgraph：使用random walk从G中采样子图，假设G的语义在局部结构中很好的保留。

在这里插入图片描述

Graph Contrastive Learning

本文提出了用于(自监督)GNN预训练的图对比学习框架(GraphCL)。由四部分组成：

(1)Graph data augmentation；

(2)GNN-based encoder：提取图级表示向量；

(3)Projection head：非线性变换g(.)，将表示向量映射到另一latent space，在该潜在空间中计算对比损失，用两层MLP来获取zi，zj；

(4)Contrastive loss function：定义L来最大化正样本对zi，zj与负样本对之间的一致性。

计算余弦相似度：
在这里插入图片描述

Loss Function：
在这里插入图片描述

The Role of Data Augmentation in Graph Contrastive Learning

在这里插入图片描述

不同数据增强的loss曲线

在这里插入图片描述

从该曲线可以看出，对于不同的数据增强类型对，loss下降速度总是比相同类型的数据增强慢，但应用相同的增强类型对通常不会带来最佳的性能。

边缘扰动有利于社交网络，但会损害生化分子网络。由热力图可知，EdgePert提高了社交网络数据集COLLAB和ROT-B以及PROTEINS的性能，但损害了NCI1的性能。从这些信息可以得出，与社交网络相比，一些生物分子数据语义对于Edge更加敏感。比如NCI1单边变化为共价键的移除或添加，这可能极大改变了化合物的性质。相比之下，社交网络更能容忍边缘扰动。

在这里插入图片描述

图1表明无论边缘扰动比率如何，边缘扰动都会使NCI1性能恶化，图2表明随着扰动比率的增大，提高了COLLAB的性能。

图3、4假设AttrMask也很重要，Masking Ratio越高，可以看出在RDT-B和COLLAB数据集上其性能更好。

在这里插入图片描述

采取masking distribution deg ^α _n而不是均匀分布后，n为节点度数，α为控制因子，α越大表明高度数节点被mask的更多。有上述两图可知，对于密集的COLLAB数据集，α越大，性能越好。

节点删除在数据集中通常是有益的。丢弃了某些节点（如化合物中的H原子或者社交网络的边缘节点）不会改变语义信息。subgraph一般来说也对所有数据集都有益。

在这里插入图片描述

由上述两图可知，对于密集的COLLAB数据集，看出α越大性能越好；对于PROTEINS数据集这个不太稠密的图，α越大性能不一定越好。

Comparison with the State-of-the-art Methods

Semi-supervised learning.

在这里插入图片描述

Unsupervised representation learning.

在这里插入图片描述

Transfer learning.

在这里插入图片描述

Adversarial robustness.

在这里插入图片描述

tutoujiehegaosou

关注

17
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
Graph Contrastive Learning with Augmentations

GraphCL的学习笔记
复制链接

扫一扫

专栏目录

tutoujiehegaosou CSDN认证博客专家 CSDN认证企业博客

码龄5年

3: 原创

78万+: 周排名

23万+: 总排名

2618: 访问

: 等级

70: 积分

32: 粉丝

39: 获赞

1: 评论

36: 收藏

私信

关注

热门文章

分类专栏

Graph 2篇

最新评论

LIGHTGCL: SIMPLE YET EFFECTIVE GRAPH CONTRASTIVE LEARNING FOR RECOMMENDATION
CSDN-Ada助手: 非常祝贺您撰写的第三篇博客！标题“LIGHTGCL: SIMPLE YET EFFECTIVE GRAPH CONTRASTIVE LEARNING FOR RECOMMENDATION”引人注目。您在这篇博客中提出的简单而有效的图对比学习方法对于推荐系统具有重要意义。我特别欣赏您对于解决实际问题的务实态度。在下一步的创作中，我建议您可以进一步探讨该方法在不同领域的适用性，并结合实际案例展示其效果。此外，您还可以考虑与其他近期相关研究进行对比和探讨，以便进一步提升方法的可靠性和实用性。我期待着您未来的创作，相信您会继续以谦虚的态度为我们带来更多有价值的内容。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Graph Contrastive Learning with Augmentations
CSDN-Ada助手: 很棒的学习笔记！你对GraphCL的研究和实验结果做了很深入的分析，这对于理解GNN在自监督预训练中的应用潜力非常有帮助。除了学习率、批量大小和dropout参数的影响，或许你可以进一步探讨一些其他的数据增强方法，比如Mixup、CutMix等，它们对于图像数据的预训练也有一定的效果。另外，可以考虑对模型的正则化方法进行进一步的研究，比如L1、L2正则化等，来提高模型的泛化能力。希望你能继续分享更多关于GraphCL和GNN的学习心得和实践经验，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
uni-app中vuex配置出现的问题
CSDN-Ada助手: 推荐小程序技能树：https://edu.csdn.net/skill/mini_programs?utm_source=AI_act_mini_programs

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。