Graph Contrastive Learning Meets Graph Meta LearningA Unified Methodfor Few-shot Node Tasks

mumukehao

于 2024-10-04 21:42:15 发布

阅读量761

点赞数 9

分类专栏：对比学习文章标签：图对比学习

本文链接：https://blog.csdn.net/chairuilin/article/details/142707281

版权

对比学习专栏收录该内容

24 篇文章 0 订阅

订阅专栏

加粗样式WWW24
推荐指数： #paper/⭐⭐
通篇在讲元学习，但是个人觉得和元学习没有关系。因此从个人的理解来记录这篇文章
个人的粗浅的理解：典型的多视图对比，但是套上了元学习的外壳。写作能力真的很强

文章配图
（个人理解)首先N-way-k-shot可以理解为：假设一个batch有N个样本，那么每个样本有k个相近的样本互为正样本。

模型架构

给定一个图表述为 $(X, A)$ ，我们可以应用三个不同的图增强： $KaTeX parse error: Undefined control sequence: \textasciitilde at position 46: …\mathbf{A}_{3} \̲t̲e̲x̲t̲a̲s̲c̲i̲i̲t̲i̲l̲d̲e̲{}\mathcal{A}$
那么，对应的三个增强图为： $(X_1,\mathrm{A}_1),(X_2,\mathrm{A}_2),(X_3,\mathrm{A}_3)$
$L:=f_\text{ema}(X_1,A_1), S:=f_\text{ema}(X_2,A_2), Q:=g(f(X_3,A_3)),$
lookup emb L以及Support emb S是由动量编码器 $f_{emb}$ 生成。Query emb Q是由可训练的图编码器以及映射头g生成。 $f_{ema}$ 的参数由 $f$ 动量更新（详情可见moco，下也有公式描述）
首先，我们可以得到query node（由lookup emb L得来的）并表示他们为： $\{L_{v_1},\cdots,L_{v_N}\}$ （相当于一个batch)。对于每一个 $\in[1,\dots,N]$ ，我们可以测量得到 $L_{vi}$ 与所有support节点的嵌入 $\{S_1,\cdots,S_{|\mathcal{V}|}\}$ 之间的相似性。S中最高的k个相似相关的嵌入将会被选取作为support集合。我们表示他们为： $\{S_{v_i^1},\cdots,S_{v_i^k}\}_{i=1}^N$
我的理解：从lookup emb中取一个节点嵌入 $L_{i}$ ,我们查询在 $S$ 中与 $L$ 最相近的前k个节点集合，表示为 ${S_{vi^1},\dots,S_{vi^k}}$ 。由于一个批次有N个样本，整个support set就是： $\{S_{v_i^1},\cdots,S_{v_i^k}\}_{i=1}^N$ 。我们可以得到query nodes emb： $\{Q_{v_1},\cdots,Q_{v_N}\}$ 。
最终，整个任务可以表示为： $\mathcal{T}=\{Q_{v_{i}},\{S_{v_{i}^{j}}\}_{j=1}^{k}\}_{i=1}^{N}$
（即：可以粗浅理解为：Q集与S集之间的对比）

编码器的参数动量更新：

$\theta_{\mathrm{ema}} = m\theta_{\mathrm{ema}}+(1-m)\theta$
m是超参。其借鉴了moco，感兴趣可以自行搜寻

损失函数：

$L_{COLA}(\{Q_{v_i},\{S_{v_i^j}\}_{j=1}^k\}_{i=1}^N)=-\sum_{i=1}^N\frac1k\sum_{i=1}^k\log\frac{\exp(Q_{v_i}\cdot S_{v_i^j}/\tau)}{\sum_{v\in S_t}\exp(Q_{v_i}\cdot v/\tau)},$
这可以如何理解呢？可以理解为：Q与S集合中前k近的向量做对比。