Graph Representation Learning学习笔记-chapter6

最新推荐文章于 2024-07-08 22:48:20 发布

Dodo·D·Caster

最新推荐文章于 2024-07-08 22:48:20 发布

阅读量407

点赞数

分类专栏：图特征学习文章标签：学习深度学习机器学习

本文链接：https://blog.csdn.net/qq_45347768/article/details/127460557

版权

7 篇文章 1 订阅

订阅专栏

Chapter6 Graph Neural Networks in Practice

讨论应用、优化问题、损失函数和正则化的使用

GNNs的主要应用：

参数：

全监督的形式训练GNNs

请添加图片描述

- $Y_u$：one-hot vector
    - 指示训练节点u的类别
- softmax($Z_u,Y_u$)：节点u属于类别$Y_u$的预测的可能性

请添加图片描述

    - $w_i$：可训练的参数

训练节点：消息传递中包含的节点同时也被用来计算损失
转换测试节点：一些节点没有标签，虽然会被用于消息传递时生成hidden representation，但输出的最后一层嵌入中这些节点不会用于损失函数的计算
归纳测试节点：既不用于消息传递也不用于损失函数

方法1：softmax classification loss

方法2：squared-error loss

请添加图片描述

方法：采用Chapter3&4里面的pairwise node embedding loss functions

如对节点分类的损失微调之前，预先训练GNN来重建缺失的边

在GNN中，由于消息传递过程以及很好地encode邻居信息，所以pre-training的效果不佳，但是在DGI中表现很好

Pre-training损失函数：让GNN模型可以学习生成能够区分真实的图和它的损坏部分的节点嵌入？？

node-level消息传递方程如果直接实现在计算上很低效（因为很多节点会有共同邻居）

基本思想：基于稀疏矩阵乘法来实现消息传递操作

请添加图片描述

为了限制内存占用和方便mini-batch training，可以采用节点的子集来进行消息传递。

在图中每个patch的子集上计算node-level GNN equation
挑战：
- 不能只跑每个子集的消息传递而不计算损失
- 每次移除一个节点，需要同时移除对应的边，不能保证选择的随机子集能构成一个连通的图
- 为每个mini-batch选择随机子集不利于模型的性能
解决方式：subsampling node neighborhoods
- 基本思想：首先为一个batch选择目标节点集合，然后递归地采样这些集合的邻居来确保图的连通性

GNN正则化方法