图神经网络——GraphSAGE

GraphSAGE介绍

          GraphSAGE(Graph Sample and AggregatE)是一种图神经网络(GNN)框架,旨在高效地处理大规模图数据。  它通过对邻居节点进行采样和特征聚合来更新节点表示,避免了全图级的计算,从而在大规模图上表现出色。

优势: 

        1. 可拓展性强:只采样了固定数量的邻居节点,GraphSAGE能够处理大规模图数据,避免了全图计算的高成本。

        2. 灵活性:GraphSAGE可以选择不同的聚合函数,适用不同的应用场景和需求

        传统GCN通常是将邻居节点和自身节点加权求和或求平均,然后和权重矩阵W进行点乘得到新的向量表达式。

        h_{v}^{k+1} = \sigma (W_{k} \sum_{u\epsilon N(v)}(\frac{h^{k}_{u}} {|N(v)|} + B_{k}h_{v}^{k}))

        GraphSage的方式为如下, 这里的AGG是聚合函数,由多种形式可以做到,具体来说就是就是在上一层中邻居节点的聚合与当前层的节点参数concat在一起,再与可学习的参数Wk 点乘并激活后形成下一层的向量。ACG聚合方式可以有多种形式,当前层与上一层的关系从求和改成contact,  使得更加突出自身的向量,自身的信息更重要。

h_{v}^{k+1} = \sigma (W_{k} * [ AGG ({h_{u}^{k-1}, \forall u \epsilon N(v)}) , B_k h_v^k])

         根据算法中最核心的部分就是聚合上一层邻居节点以及拼接上一层邻居节点和自身节点。

AGGREGATE聚合函数

        1. Mean aggregate: 取邻居节点特征值的平均数

        2. LSTM aggregate: 经过LSTM网络聚合

        3. Poolingaggregator: 取邻居节点特征的最大值。

邻居采样

        GraphSage聚合并不会对所有邻居聚合,而是采用邻居采样,采样聚合固定长度的邻居数量。

        为什么需要邻居采样:GraphSAGE相比与GCN,当不采样的时候,可能还没有GCN好,它只是对节点进行简单的标准化,没有像GCN左乘和右乘度的根号,能实现行和列的标准化,它考虑的没有GCN细致,而采样能够完美解决这个问题。

        邻居采样的规则

        1. 邻居节点比采样节点多, 那么在邻居节点不重复采集相应个数的节点

        2. 邻居节点比采样几点少, 那么在邻居节点重复采样相应个数的节点

作者表明该模型K = 2 和 S1 * S2 <= 500时效果会比较好, S1, S2分别时第一层聚合的邻居数量和第二层聚合的邻居数量。

        

举个例子: 对周围的3个节点采样,求1,2节点的聚合

Mini_batch

        Mini_batch其实是从目标节点反推回去的,首先最后一层K层为B^{K}层,我们反推回去上一层需要采样聚合的节点为当前层的节点和其邻居节点的集合。

                B^{K - 1} = B^{K} \bigcup N_K(u)

举个例子

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值