GraphSAGE聚合流程计算实例_graphsage池化算子举例-CSDN博客

本文链接：https://blog.csdn.net/today__present/article/details/130441244

本篇中我们只讨论聚合流程，不考虑GraphSAGE的小批量训练等内容。

我们先来看一下GraphSAGE的聚合流程伪代码，之后会给出两个具体的计算例子进行说明：
在这里插入图片描述
11行中， $N^{(k)}(u)$ 表示节点u的邻居节点采样函数（指的是从其邻居节点中选取一批节点）,Agg()指的是邻居节点的聚合算子，有平均（加和）聚合算子，也有最大（平均）池化聚合算子。我们接下来会以平均聚合算子和平均池化聚合算子为例进行说明。
12行中， $h_u^{(k-1)}||h_{N(u)}^k]$ 表示两个向量缀连起来（即[h1[1], h1[2], …, h1[n], h2[1], h2[2], …, h2[m]]），对这个缀连起来的向量乘一个 $W^k$ 进行线性变换(往往在这一步将向量的维数转换成想要嵌入表示输出的 $d_{out}$ 维)，再加个激活函数进行非线性变换。
最后对得到的向量进行归一化，就对节点 $u$ 完成了一次聚合过程。

数据准备

对于下面这样一个图：
在这里插入图片描述

假如我们想要节点的嵌入输出的outputdim为2维的，输入的图对应初始特征数据如下：
$id,x_0,x_1,x_2,x_3\\ 1,0.5,0.6,0.7,0.8\\ 2,0.3,0.8,0.3,0.4\\ 3,0.7,0.9,0.6,0.9\\ 4,0.2,0.1,0.2,0.3\\ 5,0.8,0.4,0.3,0.2\\$

我们先完成第一步，邻居节点聚合。
这一步可以采用多种聚合算子，我们在此以平均聚合算子与平均池化聚合算子为例。

平均聚合算子

这里的Agg（）是指取平均： $AVERAGE(h_j)$

$h_4 ^{(0)} =[0.2,0.1,0.2,0.3]^T$
节点4的邻接节点为2，3，5
我们用平均聚合算子AVERAGE(h)对2，3，5这三个节点的信息进行聚合：
$Agg^{(1)}(h_2(0),h_3(0),h_5(0))$
就是对这三个向量对应值相加取均值，得到：
$h_{N(4)}^{(1)}=[0.6,0.7,0.4,0.5]$

由上面我们得到 $h_4^{(1)}$ 为：
$\sigma(W^{(1)}[h_u^{(0)},h_{N(u)}^{(1)}]) =\sigma(W^{(1)}[0.2,0.1,0.2,0.3,0.6,0.7,0.4,0.5]^T)$
为了使得输出是一个 $2 \times 1$ 的向量，我们设置 $W^{(1)}$ 为一个 $2 \times 8$ 的矩阵，比如我们初始化为：

$1,0,0,0,1,0,1,0\\0,1,0,1,0,0,1,0$

与上面的向量相乘，得到 $1.2,0.8]^T$

将其代入激活函数（ReLU）后进行归一化，就正式得到
$h_4^{(1)} = [0.83205029,0.5547002 ]^T$
这样就正式完成了对节点4的一次聚合操作。
对第一层的其他节点的操作也是类似的。

平均池化聚合算子

平均池化聚合算子，就是指 $AVERAGE[\sigma(Wh+b)]$ , $\sigma$ 是激活函数(ReLU)
具体怎么做的呢？
我们待处理的邻接节点：
$h_2^{(0)} = [0.3,0.8,0.3,0.4],\\ h_3^{(0)} = [0.7,0.9,0.6,0.9],\\ h_5^{(0)} = [0.8,0.4,0.2,0.3]$
此刻我们在此添加一个dense层（全连接层）。这里全连接层是指：对这每个节点，其向量的每个分量经过了一个全连接层。

对于 $h_j$ ，输出是： $ReLU(Wh_j+b)$

我们引入一个权重矩阵 $W$ ，它是hidden dim×input dim维度的，在这里input dim是4维，我们设定这个隐藏层的输出维度为3，那么W就是一个3×4的矩阵；对于同一层中的每个邻居节点，W是固定的。
b就是一个hidden_dim(3)维的向量。

所以说线性变换的输出就是

在这里插入图片描述

这样的话:
对于节点2，我们的输入 $h_2{(0)} = [0.3,0.8,0.3,0.4]$ 是4维的。
所以
$w11x1+w12x2+w13x3+w14x4+b1\\ o2 = w21x1+w22x2+w23x3+w24x4+b2\\ o3 = w31x1+w32x2+w33x3+w34x4+b3$
所以实际上 $o = Wh_2{(0)}$