​ICLR 2023 | 图数据分布外检测:从能量模型出发

c6229ab06e2ebda5f238d9c15a36d5f1.gif

©PaperWeekly 原创 · 作者 | 吴齐天

单位 | 上海交通大学博士生

研究方向 | 机器学习与图深度学习

继续探索 Graph OOD 的相关问题,与以往工作不同的是,这篇工作避开了复杂的数学推导和琐碎的数据生成过程,直接从简单有效的判别模型入手研究图上的 OOD 检测问题。

9cf6cb33480bf33b1a1644cd1653e1aa.png

论文题目:

Energy-based Out-of-Distribution Detection for Graph Neural Networks

论文链接:

https://arxiv.org/abs/2302.02914

代码链接(含实验细节说明):

https://github.com/qitianwu/GraphOOD-GNNSafe

尽管针对图数据的学习方法目前已取得了空前的进展,绝大部分现有的方法都假设训练数据与测试数据来自同一分布。目前有大量研究表明,现有的图深度学习模型(如图神经网络)通常在分布外数据上表现差强人意,这也使得针对图数据分布外泛化(Out-of-Distribution Generalization,简称 OOD 泛化)问题的研究 [1,2] 逐渐流行起来。

OOD 泛化问题旨在解决训练和测试分布不一致的问题,其学习目标是为了提升模型在新的未知分布的测试数据上的性能。而另一类比较常见的实际问题,是分布外检测(Out-of-Distribution Generalization Detection)[3,4],问题定义为:

当分类器在有限观测的训练数据上完成训练后,需要具备识别测试集中不同于训练主体分布的数据(即 OOD 数据)的能力。

尽管 OOD 检测在图像领域已被广泛研究,但针对图数据的分布外检测还是一个几乎未被探索的领域 [5]。

fa538e38f38350ac2c55b3dc0b2f2a6e.png

图上节点分布外检测的问题定义

首先,从整体上看,与图片不同的是,图结构数据中的每个样本通常是图上的节点。由于节点互联的特性,节点样本之间存在着依赖关系,导致了样本的非独立性。因此,在对 OOD 样本进行判定时,需要考虑到这种数据依赖关系(data inter-dependence)。

cc54ae38b42ed6c2b81f005cfbb723e1.png

▲ 图片样本分布外检测与图中节点分布外检测的对比。图片数据可以看作i.i.d.产生的独立样本,而图中的节点样本存在互相的依赖关系。

下面我们对图上的 OOD 检测问题给出定义。假设输入数据样本构成了一个图 , 是节点集合, 是连边集合,使用 表示邻接矩阵。图中每个节点 都是一个样本,包含输入特征 和标签 。

图中的节点集合 分成了训练集 和测试集 。定义 和 ,我们需要训练一个节点分类器 ,它能预测节点的标签 。此外,更重要的是,这一分类器具备识别分布外样本的能力。具体的,考虑一个由 产生的决策函数 ,使得对于任意输入 有:

329f3e319f0e1782c70c039b49ad43f3.png

其中 表示节点 在图中对应的邻居子图。

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
我们的分类器可以秘密满足多源域适应。 多源域适应是指在训练模型时,通过利用来自多个不同领域的数据来提高分类器在目标领域上的性能。传统的领域适应方法通常要求知道源域和目标域的标签信息,而且需要训练过程中显式地使用源域数据。然而,在一些情况下,我们可能无法取得源域数据或者不希望显示地使用源域数据。 我们的分类器具有秘密满足多源域适应的能力。它可以在不泄露源域数据的情况下,利用多个源域的数据进行训练,从而提高在目标域上的分类性能。这种方法的优势在于保护了源域数据的隐私,同时提高了分类器的泛化能力。 我们的分类器使用了一种先进的深度学习技术,可以在没有源域数据的情况下进行域适应。它借助于迁移学习和领域自适应的理论,能够自动学习源域和目标域之间的差异,并将这些差异应用于目标域的分类任务中。 具体而言,我们的分类器采用了一种深层神经网络结构,通过共享层和特定领域的适应层,实现了对多个源域数据的学习和域适应。在训练过程中,我们使用了无监督的领域适应方法,通过最小化源域数据和目标域数据之间的领域差异,来提高分类器在目标域上的性能。 通过使用我们的分类器,用户可以在不泄露源域数据的情况下,实现秘密的多源域适应。这对于一些敏感数据或隐私保护方面的需求是非常有价值的。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值