图神经网络入门篇Graph Neural Network

最新推荐文章于 2025-03-02 17:42:33 发布

爱编程真是太好了

最新推荐文章于 2025-03-02 17:42:33 发布

阅读量4k

点赞数 5

分类专栏：知识图谱深度学习机器学习文章标签：知识图谱

本文链接：https://blog.csdn.net/u012526436/article/details/106528029

版权

深度学习同时被 3 个专栏收录

44 篇文章

订阅专栏

机器学习

41 篇文章

订阅专栏

知识图谱

5 篇文章

订阅专栏

前言

在我上一篇博客，介绍基于random walk的节点表示方式，该方法的主要是思想是以one-hot的形式，经过Embedding层得到node vector，然后优化以下的似然函数来得到最优的Embedding Matrix

$\sum_{u \in V} logP(N_R(u)|z_u)$

该方法有很多缺点

参数没有共享，一个节点对应一个embedding值
图通常需要用到节点特征，该方法没有办法结合节点特征

本文将会介绍基于GNN的表示方式，尽可能解决以上的问题。

一种简单的方法

图像有CNN，序列问题有RNN，但是对于图结构来说，这些模型都不适用，图的节点数量不固定，通常都会有很复杂的拓扑结构，无论是CNN还是RNN都没有办法处理这样动态的数据结构，那么如何解决这个问题呢？

最简单的方法就是采用图的邻接矩阵，并且把节点的特征拼接进来，再把拼接后的数据喂给一个神经网络。

在这里插入图片描述

该方法虽然可行，但是存在一些缺点

当图过大时，邻接矩阵过大，对于显存要求过于苛刻
训练好的模型不适用于不同大小的图，如果我们想用现有的模型表示新加的节点embedding，需要重新训练

基于该结构，我也写了另外一篇博客详细介绍，图卷积神经网络

基于聚合操作的图神经网络

除了上面提到的邻接矩阵的方式，实际上我们更需要一种方法能直接泛化训练过程没有出现过的顶点，首先我们定义几个符号

G 图
V 图中的节点
A 邻接矩阵
X 节点特征 $\in \Reals^{m×|V|}$ m表示特征数量

从之前的博文中，我们知道，一个节点的embedding是由其邻居节点决定的，那么我们是否可以使用神经网络来聚合其邻居节点的信息呢？答案是肯定的，我们给每一个节点根据其邻居定义一个计算图，如下图所示。

在这里插入图片描述

这样的结构让节点在每一层都有其embedding表示，其中第一层是每个节点的特征即 $x$ ，第k层是经过k跳后的节点embedding信息（层约深，获取到的全局信息就越多）图中灰色部分表示的是聚合操作，聚合操作有很多种方式

Average neighbor messages

我们先看一种常用的方式，取均值。假如我们要计算 $v$ 节点的embedding，首先始化第0层的embedding等于其节点特征

$h^0_v=X_v$

然后计算下一层的emebdding，可以看到，计算分为了两部分，第一块是对 $v$ 节点的邻居节点的上一层的embedding取均值，然后与 $v$ 节点的上一层的embedding取加权平均数，这里的两个加权值就是我们需要训练的参数，最后外面加一层非线性变化，注意，这里的 $\sigma$ 是指非线性变化，不一定是sigmoid函数

$h_v^k=\sigma(W_k \sum_{u \in N(v)}\frac{h_u^{k-1}}{|N(v)|} + B_k h_v^{k-1})$