思路
GNN已经被证明在图表示学习方面表现很好,但在处理OOD数据时往往缺乏泛化能力。
OOD(out of distribution):现有的图神经网络依赖训练集和测试集是同分布的假设,现实世界存在各种形式的分布偏移,测试集就是分布外数据,将在训练数据上表现良好的gnn,用在测试集上会显著失败。所以需要捕获预测模式与标签之间的不变关系。
不变学习: 解决针对OOD的泛化。基于不变准则:存在一定比例的数据能够捕获不同环境中数据与标签之间的不变关系。然而,现有的DIR、GIL依赖环境的划分。
需要做的:
1.通过mixup产生足够多的环境
2.提升mixup方法使得尽可能多得保存不变信息同时排除掉环境相关的有欺骗性的相关关系。
Notations and Preliminaries
其中G是图,Y是标签
问题:把图分为两部分,一部分是不变子图和环境子图
使得不变子图决定标签的类别,而削弱环境子图的影响。
方法
Invariant Subgraph Extractor
根据p的伯努利分布在图中采样边得到不变子图
Environment Mixup.
得到K个环境
Invariant Mixup.
Manifold Mixup
实验结果