GraphSAGE论文阅读笔记

最新推荐文章于 2025-04-17 17:36:42 发布

yanhe156

最新推荐文章于 2025-04-17 17:36:42 发布

阅读量8.2k

点赞数 8

分类专栏： graph

本文链接：https://blog.csdn.net/yanhe156/article/details/97793589

版权

GraphSAGE是一种归纳式图神经网络框架，能够在不预先知道所有节点的情况下，有效地为新节点生成embedding。它通过采样和聚合邻居节点信息进行前向传播，适合大规模图数据。论文中探讨了不同类型的聚合器，如均值聚合器、LSTM聚合器和Pooling聚合器，并在多个数据集上进行了实验，展示了其在效率和性能上的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文: Inductive Representation Learning on Large Graphs

1 Motivation

大多数graph embedding框架是transductive(直推式的), 只能对一个固定的图生成embedding。这种transductive的方法不能对图中没有的新节点生成embedding。相对的，GraphSAGE是一个inductive（归纳式）框架，能够高效地利用节点的属性信息对新节点生成embedding。

( 这里的transductive和inductive用的很精髓，统计机器学习可以分成两种: transductive learning, inductive learning.
transductive learning: To specific (test) cases, 指的是测试集是特定的(固定的样本);
inductive learning: 测试集不是特定的。
一般我们的目的是做 inductive learning。)
GNN中经典的DeepWalk, GCN方法都是transductive learning。

2 前向传播

论文中提出的方法称为graphSAGE, SAGE指的是 SAmple and aggreGat。 sample和aggregate就是主要的两步。

在这里插入图片描述
上面是为红色的目标节点生成embedding的过程。k表示距离目标节点的搜索深度，k=1就是目标节点的相邻节点，k=2表示目标节点相邻节点的相邻节点。
对于上图中的例子，
第一步是采样，k=1采样了3个节点，对k=2采用了5个节点；
第二步是聚合邻居节点的信息，获得目标节点的embedding；
第三步是使用聚合得到的信息，也就是目标节点的embedding,来预测图中想预测的信息;

在这里插入图片描述
伪代码中2到7行的两层循环，for $\ldots K$ 表示深度从1到最大值K，for $\in \mathcal{V}$ 表示对图中的每个节点。
$\mathcal{N}(v)$ 表示节点v的邻居，伪代码中也说明了 $\mathcal{N}$ 表示neighborhood function。
第4行里， $\left\{\mathbf{h}_{u}^{k-1}, \forall u \in \mathcal{N}(v)\right\}$ 表示节点 $v$ 的任意相邻节点的聚合信息的集合， $\mathbf{h}_{\mathcal{N}(v)}^{k}$ 是一个向量，表示从节点 $v$ 的相邻节点获取的信息。AGGREGATE $_{k}$ 表示可微分的聚合函数，这篇文章后面尝试了多种方法。注意 $k - 1$ 不表示相邻，表示相邻的是 $\mathcal{N}(v)$ 。
第5行，将从相邻节点获取的信息 $\mathbf{h}_{\mathcal{N}(v)}^{k}$ , 和这个节点自身的信息 $\mathbf{h}_{v}^k$ 拼接。