#今日论文推荐#莱斯大学胡侠团队 ICML 2022 杰出论文: 新型图数据增强方法 G-Mixup｜附作者对话

最新推荐文章于 2025-05-04 16:55:47 发布

wwwsxn

最新推荐文章于 2025-05-04 16:55:47 发布

阅读量213

点赞数

分类专栏：深度学习文章标签：深度学习计算机视觉人工智能

原文链接：https://www.aminer.cn/research_report/62ea27d77cb68b460ffa9cab

版权

深度学习专栏收录该内容

716 篇文章

订阅专栏

#今日论文推荐#莱斯大学胡侠团队 ICML 2022 杰出论文: 新型图数据增强方法 G-Mixup｜附作者对话

本文我们来关注一下今年获奖的一篇优秀工作。AI 科技评论此次采访到获得杰出论文奖的莱斯大学胡侠团队，为我们解读他们的研究工作。该团队的获奖论文题目为：《G-Mixup: Graph Data Augmentation for Graph Classification》。作者：Xiaotian Han、Zhimeng Jiang、Ninghao Liu、Xia Hu。在这项研究中，作者提出了一种新的图数据增强方法：G-Mixup，实验表明，G-Mixup 能够提高图神经网络的泛化性和鲁棒性。
胡侠，现任美国莱斯大学终身副教授，数据科学中心主任，AIPOW联合创始人兼首席科学家。其主导开发的开源系统AutoKeras成为最常用的自动机器学习框架之一（超过8000次star及1000次fork），开发的NCF算法及系统（单篇论文他引3000余次）成为主流人工智能框架TensorFlow的官方推荐系统，主导开发的异常检测系统在通用、Trane、苹果等公司的产品中得到广泛应用，研究工作多次获得最佳论文（提名）奖。

图数据在我们的现实生活中无处不在，我们可以使用图来建模和描述各种复杂网络系统。而为了将图数据应用于具体任务，我们首先需要对图数据进行表征。近年来，通过深度学习技术对图数据进行表示学习的图神经网络（GNNs），在节点分类任务上取得了最优性能，因而已被广泛用于图形分析。同时，数据增强（data augmentation）和 Subgraph（子图）也被用于图分析，它们通过生成合成图来创建更多训练数据，以提高图分类模型的泛化性能。
当前流行的数据增强方法 Mixup 通过在两个随机样本之间插入特征和标签，在提高神经网络的泛化性和鲁棒性方面显示出优越性。但是，Mixup 更适用于处理图像数据或表格数据，直接将其用于图数据并非易事，因为不同的图通常：（1）有不同数量的节点；（2）不容易对齐；（3）在非欧几里得空间中的类型学具有特殊性。
为此，提出了一种 class-level 的图数据增强方法：G-Mixup。具体来说，首先使用同一类中的图来估计一个 graphon。然后，在欧几里得空间中对不同类的 graphons 进行插值，得到混合的 graphons，合成图便是通过基于混合 graphons 的采样生成的。经实验评估，G-Mixup 显着提高了图神经网络的泛化性和鲁棒性。
G-Mixup的实现方法
G-Mixup。G-Mixup 是一种通过图形插值的class-level数据增强方法。具体来说，G-Mixup 对不同的图生成器（graphon）进行线性插值以获得新的混合的生成器。然后，基于混合的新的生成器对合成图进行采样得到新的图数据以进行数据增强。改论文从理论上证明从该生成器中采样的图部分具有原始图的属性。
如图1所示，G-Mixup包括三个关键步骤：（1）为每一类图估计一个graphon，（2）混合不同图类的graphons，以及（3）基于混合的graphons采样生成合成图。

论文题目：G-Mixup: Graph Data Augmentation for Graph Classification.
详细解读：https://www.aminer.cn/research_report/62ea27d77cb68b460ffa9cabhttps://www.aminer.cn/research_report/62ea27d77cb68b460ffa9cab
AMiner链接：https://www.aminer.cn/?f=cs