graphSAGE/Inductive Representation Learning on Large Graphs

KpLn_HJL

已于 2022-06-13 12:02:18 修改

阅读量262

点赞数

分类专栏： # 图模型机器学习文章标签：人工智能论文笔记深度学习

于 2022-06-13 12:01:38 首次发布

本文链接：https://blog.csdn.net/sinat_41679123/article/details/125189769

版权

机器学习同时被 2 个专栏收录

32 篇文章 1 订阅

订阅专栏

图模型

4 篇文章 0 订阅

订阅专栏

本文探讨了图神经网络（GNN）如何通过邻居节点进行无监督学习，以生成节点的emb表示。即使对于未见过的节点，也能通过学习其邻居节点来获取emb。算法包括节点emb初始化、更新及归一化。实验部分展示了在节点分类任务上的应用，使用了不同的aggregator（如mean, LSTM, pooling）并在多个数据集上进行了对比。损失函数包括无监督损失和交叉熵损失，评估指标为F1分数。

摘要由CSDN通过智能技术生成

总结

通过邻居节点，计算节点emb，可以无监督学习

细节

对于unseen的节点也能产出emb，主要是通过对邻居节点的学习

计算节点emb的算法步骤
在这里插入图片描述

节点emb初始化
计算节点v的邻居节点emb： $h_{\mathcal{N}(v)}^k \leftarrow \text{AGGREGATE}_k(\{ h_u^{k-1}, \forall u \in \mathcal{N}(v) \})$
更新节点v的emb： $h_v^k \leftarrow \sigma(\bold{W}^k \cdot \text{CONCATE}(h_v^{k-1}, h_{\mathcal{N}(v)}^k))$
emb归一化

上述算法可以延伸到mini-batch用法上
在这里插入图片描述
计算loss，尽量让相邻的节点有相似的emb，距离远的节点emb不同，loss如下：
$J_\mathcal{G}(\bold z_u) = -\log(\sigma(\bold z_u^T \bold z_v)) - Q \cdot \mathbb E_{v_n \sim P_n(v)}\log(\sigma(- \bold z_u^T \bold z_{v_n}))$
其中：

$\bold z_v$ 是节点u的一个邻居节点
$P_n$ 是negative sampling
$Q$ 是negative samples的数量
$\bold z_u$ 不是从emb table中读出来的，而是从邻居节点的emb中计算出来的

图不像nlp/cv，邻居节点之间是无序的。因此理想的aggregator应该是对称的（对输入的各种排列结果，输出不变）

3个aggregator：mean aggregator（去掉concate），lstm aggregator（对输入顺序敏感，因此输入是一个random permutation），pooling aggregator（max-pooling）

实验

实验类别：节点分类，3个dataset（citation、reddit、ppi）
baseline：random classifier，lr，deepwalk，deepwalk+random emb拼接
loss函数：unsupervised loss如上，以及cross-entropy as supervised loss
评估指标：f1
实验结果：
在这里插入图片描述