GCN基本原理与tensorflow2.0实现

最新推荐文章于 2024-07-05 10:57:44 发布

zhong_ddbb

最新推荐文章于 2024-07-05 10:57:44 发布

阅读量5.6k

点赞数 6

分类专栏：深度学习 tensorflow2.0 推荐系统文章标签：神经网络深度学习人工智能机器学习

本文链接：https://blog.csdn.net/zhong_ddbb/article/details/109864783

版权

深度学习同时被 3 个专栏收录

26 篇文章 9 订阅

订阅专栏

推荐系统

22 篇文章 4 订阅

订阅专栏

tensorflow2.0

17 篇文章 6 订阅

订阅专栏

文章目录

图卷积神经网络（GCN）的核心思想： 学习一个映射 $f (.)$ ，通过该映射图中的节点 $v_i$ 可以聚合它自己的特征 $x_i$ 与它的邻居特征 $x_j \;(j \in N(v_i))$ 来生成节点的新 $v_i$ 表示。

图卷积本质上是一种aggregation（聚合）操作，是一种局部加权平均运算。在图中"局部"是指他的邻居，简单起见，把有边的权重定义为1，无边的权重定义为0。

基本符号定义

$N=1,2,3\cdots n$ 代表所有节点的编号

$X_i$ 代表节点 $i$ 的特征向量

$A$ 代表邻接矩阵， $A_{ij}$ 代表节点 $i, j$ 之间的边的权。

$D$ 代表图的度的矩阵，是一个对角矩阵（是邻接矩阵的列和或行和），即： $D_{ii} = \sum_{k=1}^N A_{ik}$ 。

$L = D - A$ 是图的拉普拉斯矩阵（Laplacian Matrix）。

下面是一个例子（无权图）：

在这里插入图片描述

图神经网络的公式定义

这是GCN图卷积层的示意图：

在这里插入图片描述

1、基本版本

先仔细思考：通过该映射图中的节点 $v_i$ 可以聚合它自己的特征 $x_i$ 与它的邻居特征 $x_j \;(j \in N(v_i))$ 来生成节点的新 $v_i$ 表示 如何将这个过程用数学公式实现？主要包括两个部分：

（1）先聚合邻居特征，最简单的是加权平均法：
$aggregate(\mathbf X_i) = \sum_{j \in neighbor(i)}A_{ij}X_j$
注：A是带权邻接矩阵。

将其写成矩阵运算（矩阵式聚合）：
$aggregate(\mathbf X_i) = \mathbf A \mathbf X$

（2）添加自环，加入自己的特征
$\\ aggrregate(X_i) = \sum_{j \in N} A_{ij}X_{j} + X_{i}$
这样就实现了将节点本身的特征加回来了。

2、"差分"版本

存在这样一种场景：节点 $v_i$ 的特征与他的邻居节点 $x_j$ 的差距较大，这样的任务可能更加关注相邻节点间的"差分"。一般会用拉普拉斯矩阵 $L = D - A$ 来实现。
$\\ \\ aggrregate(X_i) = \sum_{j \in N} A_{ij}X_{i}- \sum_{j \in N} A_{ij} X_{j} = \sum_{j \in N} A_{ij}(X_{i}- X_{j})$
其中， $D X$ 可以理解为当前节点本来拥有的信息； $A X$ 可以理解为本次操作要减少的信息。

3、“带权”归一化版本

无论是 $A + I$ 还是 $D - A$ ，均是利用邻居节点和自身的节点求和，而不是平均。这会导致离群较远或者度较小的节点在聚合后特征较小，离群较近或者度较大的节点在聚合后特征较大。因此需要进行归一化。

令 $\hat A = A+I$ 或者 $\hat A = D-A$ 。 $\hat D$ 为 $\hat A$ 的度的矩阵。

在这里插入图片描述

所以，加权聚合的结果为：
$\hat D^{-1} \hat A X$
以下的公式解释了上式如何实现归一化：
$\begin{aligned} aggregate(X_i) &= \sum_{k=1}^N \hat D_{ik}^{-1}\sum_{j=1}^N \hat A_{ij} X_j \\ &= \sum_{j=1}^{N} \hat D_{ii}^{-1} \hat A_{ij} X_{j} \\ &= \sum_{j=1}^{N} \frac{ \hat A_{ij}}{\hat D_{ii}} X_{j} \\ & = \sum_{j=1}^{N} \frac{ \hat A_{ij}}{\sum_{k=1}^{N}\hat A_{ik}} X_{j} \end{aligned}$
这样通过 $\hat D^{-1}$ 操作，已经将求和变成加权平均求和，权值之和归一化为1。

4、对称归一化版本

在这里插入图片描述

“带权”归一化版本只考虑到了节点自身的度，实际上除了应该考虑聚合节点 $i$ 的度 $\hat D_{jj}$ ，还应该考虑被聚合节点 $j$ 的度 $\hat D_{jj}$ ，将二者的几何平均 $\sqrt{\hat D_{jj} \hat D_{jj}}$ 引入：
$\begin{aligned} \text {aggregate}\left(X_{i}\right) &=\hat{D}^{-0.5} \hat{A} \hat{D}^{-0.5} X \\ &=\sum_{k=1}^{N} \hat{D}_{i k}^{-0.5} \sum_{j=1}^{N} \hat{A}_{i j} X_{j} \sum_{l=1}^{N} \hat{D}_{i l}^{-0.5} \\ &=\sum_{j=1}^{N} \hat{D}_{i i}^{-0.5} \hat{A}_{i j} X_{j} \hat{D}_{j j}^{-0.5} \\ &=\sum_{j=1}^{N} \frac{1}{\hat{D} i i^{0.5}} \hat{A}_{i j} \frac{1}{\hat{D}_{j j}^{0.5}} X_{j} \\ &=\sum_{j=1}^{N} \frac{\hat{A}_{i j}}{\sqrt{\hat{D} i i \hat{D} j j}} X_{j} \end{aligned}$
显而易见，通过 $\hat{D}^{-0.5} \hat{A} \hat{D}^{-0.5}$ 操作，实现了 $\hat D_{ii}和\hat D_{jj}$ 的集合平均，从而剔除了被聚合节点 $j$ 的度的影响。

这是图卷积的基本操作，这种图卷积是谱图卷积的一阶近似。接着只需要将图卷积层堆积起来就构成了图卷积网络GCN。

GCN基本结构

接下来来看两个GCN结构：

（1）结构一：多层GCN

在这里插入图片描述

GCN层通过聚集来自其邻居的特征信息来封装每个节点的隐藏表示。特征聚合后，将非线性变换应用于结果输出。通过堆叠多层，每个节点的最终隐藏表示形式将包含来自其他节点的信息。

（2）结构二：用于分类的FGCN

在这里插入图片描述

GCN层后面是池化层，以将图粗化为子图（聚合更多的信息）。因为要计算每个图形标签的概率，输出层是具有SoftMax函数的线性层。

GCN层的tensorflow2.0实现

import tensorflow as tf
from tensorflow.keras import activations, regularizers, constraints, initializers
spdot = tf.sparse.sparse_dense_matmul
dot = tf.matmul


class GCNConv(tf.keras.layers.Layer):
def __init__(self,
             units,
             activation=lambda x: x,
             use_bias=True,
             kernel_initializer='glorot_uniform',
             kernel_regularizer=None,
             kernel_constraint=None,
             bias_initializer='zeros',
             bias_regularizer=None,
             bias_constraint=None,
             activity_regularizer=None,
             **kwargs):
    # 初始化不需要训练的参数
    self.units = units
    # activation=None 使用线性激活函数（等价不使用激活函数）
    self.activation = activations.get(activation)
    self.use_bias = use_bias
    
    # 初始化方法定义了对Keras层设置初始化权重（bias）的方法 glorot_uniform
    self.kernel_initializer = initializers.get(kernel_initializer)
    self.bias_initializer = initializers.get(bias_initializer)
    
    # 加载正则化的方法
    self.kernel_regularizer = regularizers.get(kernel_regularizer)
    self.bias_regularizer = regularizers.get(bias_regularizer)
    self.activity_regularizer = regularizers.get(activity_regularizer)
    
    # 约束：对权重值施加约束的函数。
    self.kernel_constraint = constraints.get(kernel_constraint)
    self.bias_constraint = constraints.get(bias_constraint)

    super(GCNConv, self).__init__()

def build(self, input_shape):
    """ GCN has two inputs : [shape(An), shape(X)]
    """
    # gsize = input_shape[0][0]  # graph size
    fdim = input_shape[1][1]  # feature dim
    
    # hasattr 检查该对象self是否有某个属性'weight'
    if not hasattr(self, 'weight'):
        self.weight = self.add_weight(name="weight",
                                      shape=(fdim, self.units),
                                      initializer=self.kernel_initializer,
                                      constraint=self.kernel_constraint,
                                      trainable=True)
    if self.use_bias:
        if not hasattr(self, 'bias'):
            self.bias = self.add_weight(name="bias",
                                        shape=(self.units, ),
                                        initializer=self.bias_initializer,
                                        constraint=self.bias_constraint,
                                        trainable=True)
    super(GCNConv, self).build(input_shape)

 
def call(self, inputs):
    """ GCN has two inputs : [An, X]
    	对称归一化版本的GCN的核心公式计算过程
    """
    self.An = inputs[0]
    self.X = inputs[1]
    # isinstance 函数来判断一个对象是否是一个已知的类型
    if isinstance(self.X, tf.SparseTensor):
        h = spdot(self.X, self.weight)
    else:
        # 二维数组矩阵之间的dot函数运算得到的乘积是矩阵乘积
        h = dot(self.X, self.weight)
    output = spdot(self.An, h)

    if self.use_bias:
        output = tf.nn.bias_add(output, self.bias)

    if self.activation:
        output = self.activation(output)

    return output

完整代码

参考文章：

GCN(Graph Convolutional Network)的理解

如何理解 Graph Convolutional Network（GCN）？

zhong_ddbb

关注

6
点赞
踩
50

收藏

觉得还不错? 一键收藏
3
评论
GCN基本原理与tensorflow2.0实现

文章目录基本符号定义图神经网络的公式定义GCN基本结构GCN层的tensorflow2.0实现图卷积神经网络（GCN）的核心思想：学习一个映射f(.)f(.)f(.)，通过该映射图中的节点viv_ivi可以聚合它自己的特征xix_ixi与它的邻居特征xj (j∈N(vi))x_j \;(j \in N(v_i))xj(j∈N(vi))来生成节点的新viv_ivi表示。图卷积本质上是一种aggregation（聚合）操作，是一种局部加权平均运算。在图中"局部"是指他的邻居，简单起见，把有边的权
复制链接

扫一扫

专栏目录