【Graph Neural Network】GraphSAGE: 算法原理，实现和应用

浅梦s

已于 2022-10-01 15:54:09 修改

阅读量6.4k

点赞数 5

分类专栏：图表示学习文章标签：图神经网络 GNN

于 2019-08-24 20:54:52 首次发布

本文链接：https://blog.csdn.net/u012151283/article/details/100045992

版权

GraphSAGE是一种归纳式图神经网络框架，用于高效学习未知顶点的embedding。它通过采样邻居顶点，使用聚合函数生成向量表示，并支持多种聚合策略如MEAN、Pooling和LSTM。在无监督和监督学习任务中，通过优化目标函数进行参数学习。在Cora数据集上的节点分类任务中，GraphSAGE表现出高准确性。

摘要由CSDN通过智能技术生成

在上一篇文章中介绍了GCN

【Graph Neural Network】GCN: 算法原理，实现和应用

GCN是一种在图中结合拓扑结构和顶点属性信息学习顶点的embedding表示的方法。然而GCN要求在一个确定的图中去学习顶点的embedding，无法直接泛化到在训练过程没有出现过的顶点，即属于一种直推式(transductive)的学习。

本文介绍的GraphSAGE则是一种能够利用顶点的属性信息高效产生未知顶点embedding的一种归纳式(inductive)学习的框架。

其核心思想是通过学习一个对邻居顶点进行聚合表示的函数来产生目标顶点的embedding向量。

GraphSAGE算法原理

GraphSAGE 是Graph SAmple and aggreGatE的缩写，其运行流程如上图所示，可以分为三个步骤

对图中每个顶点邻居顶点进行采样
根据聚合函数从聚合邻居顶点蕴含的信息
得到图中各顶点的向量表示供下游任务

采样邻居顶点

出于对计算效率的考虑，对每个顶点采样一定数量的邻居顶点作为待聚合信息的顶点。设采样数量为k，若顶点邻居数少于k,则采用有放回的抽样方法，直到采样出k个顶点。若顶点邻居数大于k，则采用无放回的抽样。
当然，若不考虑计算效率，我们完全可以对每个顶点利用其所有的邻居顶点进行信息聚合，这样是信息无损的。

生成向量的伪代码

在这里插入图片描述
这里K是网络的层数，也代表着每个顶点能够聚合的邻接点的跳数，如K=2的时候每个顶点可以最多根据其2跳邻接点的信息学习其自身的embedding表示。
在每一层的循环k中，对每个顶点v，首先使用v的邻接点的k-1层的embedding表示来产生其邻居顶点的第k层聚合表示 $h^k_{N(v)}$ ,之后将 $h^k_{N(v)}$ 和顶点v的第k-1层表示进行拼接，经过一个非线性变换产生顶点v的第k层embedding表示 $h^k_v$ 。