残差网络（ResNet）中图神经网络中应用以及示例

最新推荐文章于 2025-03-13 23:36:37 发布

jinzong53

最新推荐文章于 2025-03-13 23:36:37 发布

阅读量1.3k

点赞数 1

分类专栏：笔记文章标签：网络神经网络人工智能

本文链接：https://blog.csdn.net/weixin_44701367/article/details/132295345

版权

笔记专栏收录该内容

10 篇文章

订阅专栏

在这里插入图片描述

一、ResNet概念

在传统的神经网络中，每一层都通过非线性变换（例如ReLU）将输入映射到输出。然而，当网络层数增加时，这些非线性变换会导致梯度消失的问题，使得网络难以训练。为了解决这个问题，ResNet提出了残差块（Residual Block）的概念。

残差块由两个主要部分组成：恒等映射（Identity Mapping）和残差映射（Residual Mapping）。恒等映射即将输入直接传递到输出，而残差映射则对输入进行非线性变换，并与恒等映射相加，从而形成残差。这样的设计使得模型可以学习到残差，即剩余的映射，而不仅仅是对输入的变换。

通过引入残差连接，ResNet使得信息可以更容易地在网络中传播。即使网络非常深，梯度也可以通过残差连接直接传递到较浅层，从而避免了梯度消失的问题。此外，ResNet还通过使用批归一化（Batch Normalization）等技术来加速训练过程和提高模型性能。

在图神经网络中，每个节点通常会聚合其邻居节点的信息，并通过非线性变换来更新自身的特征表示。然而，当图网络的深度增加时，由于多次的信息传递和变换，梯度可能会逐渐消失或爆炸，导致网络难以训练。

二、概念化例子

假设我们有以下10个用户节点和它们之间的关系：

节点1：年龄=25，性别=男，兴趣爱好=篮球
节点2：年龄=30，性别=女，兴趣爱好=足球
节点3：年龄=27，性别=女，兴趣爱好=音乐
节点4：年龄=35，性别=男，兴趣爱好=游泳
节点5：年龄=22，性别=女，兴趣爱好=阅读
节点6：年龄=29，性别=男，兴趣爱好=篮球
节点7：年龄=31，性别=女，兴趣爱好=足球
节点8：年龄=28，性别=男，兴趣爱好=音乐
节点9：年龄=33，性别=女，兴趣爱好=游泳
节点10：年龄=26，性别=男，兴趣爱好=阅读

现在，我们来逐步进行计算：

归一化处理：将每个节点的属性特征进行归一化处理，例如将年龄特征除以最大年龄值，将性别特征进行one-hot编码，将兴趣爱好特征进行标准化处理。
构建邻接矩阵A：根据节点之间的关系，我们可以构建一个10x10的邻接矩阵A来表示节点之间的连接关系。例如，如果节点i和节点j之间存在边，则A[i][j]=1；否则，A[i][j]=0。
定义图卷积层计算公式：假设我们定义了两个图卷积层，分别为第1层和第2层。对于第1层的节点隐藏表示 $h_i^{(1)}$ ，我们可以通过以下公式进行计算：
$h_1^{(1)} = \sigma\left(\frac{1}{\sqrt{d_1}} h_2^{(0)} W^{(1)}\right)\\ h_2^{(1)} = \sigma\left(\frac{1}{\sqrt{d_2}} (h_1^{(0)}+h_3^{(0)}) W^{(1)}\right)\\ h_3^{(1)} = \sigma\left(\frac{1}{\sqrt{d_3}} (h_2^{(0)}+h_4^{(0)}) W^{(1)}\right)\\ ...\\ h_{10}^{(1)} = \sigma\left(\frac{1}{\sqrt{d_{10}}} h_9^{(0)} W^{(1)}\right)\\$
其中，
$\sigma(\cdot)$
表示激活函数，
$W^{(1)}$
表示第1层的权重矩阵，
$d_i$
表示节点i的度数。
引入残差连接：为了引入残差连接，我们将前一层的隐藏表示与当前层的输出进行相加。对于第2层的节点隐藏表示 $h_i^{(2)}$ ，我们可以通过以下公式进行计算：

$h_1^{(2)} = \sigma\left(\frac{1}{\sqrt{d_1}} h_2^{(1)} W^{(2)} + h_1^{(1)}\right)\\ h_2^{(2)} = \sigma\left(\frac{1}{\sqrt{d_2}} (h_1^{(1)}+h_3^{(1)}) W^{(2)} + h_2^{(1)}\right)\\ h_3^{(2)} = \sigma\left(\frac{1}{\sqrt{d_3}} (h_2^{(1)}+h_4^{(1)}) W^{(2)} + h_3^{(1)}\right)\\ ...\\ h_{10}^{(2)} = \sigma\left(\frac{1}{\sqrt{d_{10}}} h_9^{(1)} W^{(2)} + h_{10}^{(1)}\right)\\$
其中，
$\sigma(\cdot)$
表示激活函数，
$W^{(2)}$
表示第2层的权重矩阵，
$d_i$
表示节点i的度数。
全连接层映射到职业标签：在网络的最后一层，我们可以添加一个全连接层将节点的隐藏表示映射到职业标签空间。假设我们有3个职业标签（例如医生、教师和工程师），我们可以通过以下公式进行计算：

$y_1 = \sigma(h_1^{(2)} W^{(3)})\\ y_2 = \sigma(h_2^{(2)} W^{(3)})\\ y_3 = \sigma(h_3^{(2)} W^{(3)})\\ ...\\ y_{10} = \sigma(h_{10}^{(2)} W^{(3)})\\$
其中，
$\sigma(\cdot)$
表示激活函数，
$W^{(3)}$
表示全连接层的权重矩阵。

通过反向传播算法，我们可以优化网络参数，使得预测结果与真实标签尽可能接近。这样，我们就可以使用残差连接来构建图神经网络，并应用于社交网络数据的职业预测任务中。

三、含有具体数据的例子

假设我们有一个具有10个节点的图数据，并为每个节点赋予以下特征向量：

节点1: [0, 1]
节点2: [1, 0]
节点3: [1, 1]
节点4: [0, 0]
节点5: [1, 0]
节点6: [0, 1]
节点7: [1, 1]
节点8: [0, 0]
节点9: [1, 0]
节点10: [0, 1]

现在，我们来定义权重矩阵W，它是一个2x2的矩阵。我将选择以下权重值进行计算：

W = [[0.5, 0.2],
     [0.3, 0.8]]

下面是征进行线性变换和聚合的详细计算过程：

首先，进行线性变换，将节点特征与权重矩阵相乘。

节点1：H1_1 = W · [0, 1] = [0.2, 0.8]
节点2：H1_2 = W · [1, 0] = [0.5, 0.3]
节点3：H1_3 = W · [1, 1] = [0.7, 1.1]
节点4：H1_4 = W · [0, 0] = [0, 0]
节点5：H1_5 = W · [1, 0] = [0.5, 0.3]
节点6：H1_6 = W · [0, 1] = [0.2, 0.8]
节点7：H1_7 = W · [1, 1] = [0.7, 1.1]
节点8：H1_8 = W · [0, 0] = [0, 0]
节点9：H1_9 = W · [1, 0] = [0.5, 0.3]
节点10：H1_10 = W · [0, 1] = [0.2, 0.8]

接下来，进行聚合操作，将节点特征取平均值。

H2 = mean([H1_1, H1_2, H1_3, H1_4, H1_5, H1_6, H1_7, H1_8, H1_9, H1_10])
   = [mean([0.2, 0.5, 0.7, 0, 0.5, 0.2, 0.7, 0, 0.5, 0.2]),
      mean([0.8, 0.3, 1.1, 0, 0.3, 0.8, 1.1, 0, 0.3, 0.8])]
   = [0.36, 0.64]

然后，我们将聚合结果通过ReLU激活函数进行非线性映射。
```
H3 = ReLU(H2) = [max(0, 0.36), max(0, 0.64)] = [0.36, 0.64]
```

现在，我们来引入残差连接。假设在每一层的线性变换之后，我们都要添加一个残差连接。我们将把残差连接的结果与原始输入进行相加，并应用ReLU激活函数。

在第一层的线性变换之后，我们将残差连接的结果与原始输入相加：

H1_res1 = H1_1 + [0, 1] = [0.2, 0.8] + [0, 1] = [0.2, 1.8]
H1_res2 = H1_2 + [1, 0] = [0.5, 0.3] + [1, 0] = [1.5, 0.3]
H1_res3 = H1_3 + [1, 1] = [0.7, 1.1] + [1, 1] = [1.7, 2.1]
H1_res4 = H1_4 + [0, 0] = [0, 0] + [0, 0] = [0, 0]
H1_res5 = H1_5 + [1, 0] = [0.5, 0.3] + [1, 0] = [1.5, 0.3]
H1_res6 = H1_6 + [0, 1] = [0.2, 0.8] + [0, 1] = [0.2, 1.8]
H1_res7 = H1_7 + [1, 1] = [0.7, 1.1] + [1, 1] = [1.7, 2.1]
H1_res8 = H1_8 + [0, 0] = [0, 0] + [0, 0] = [0, 0]
H1_res9 = H1_9 + [1, 0] = [0.5, 0.3] + [1, 0] = [1.5, 0.3]
H1_res10 = H1_10 + [0, 1] = [0.2, 0.8] + [0, 1] = [0.2, 1.8]

对残差连接的结果应用ReLU激活函数：

H1_res_relu1 = ReLU(H1_res1) = [max(0, 0.2), max(0, 1.8)] = [0.2, 1.8]
H1_res_relu2 = ReLU(H1_res2) = [max(0, 1.5), max(0, 0.3)] = [1.5, 0.3]
H1_res_relu3 = ReLU(H1_res3) = [max(0, 1.7), max(0, 2.1)] = [1.7, 2.1]
H1_res_relu4 = ReLU(H1_res4) = [max(0, 0), max(0, 0)] = [0, 0]
H1_res_relu5 = ReLU(H1_res5) = [max(0, 1.5), max(0, 0.3)] = [1.5, 0.3]
H1_res_relu6 = ReLU(H1_res6) = [max(0, 0.2), max(0, 1.8)] = [0.2, 1.8]
H1_res_relu7 = ReLU(H1_res7) = [max(0, 1.7), max(0, 2.1)] = [1.7, 2.1]
H1_res_relu8 = ReLU(H1_res8) = [max(0, 0), max(0, 0)] = [0, 0]
H1_res_relu9 = ReLU(H1_res9) = [max(0, 1.5), max(0, 0.3)] = [1.5, 0.3]
H1_res_relu10 = ReLU(H1_res10) = [max(0, 0.2), max(0, 1.8)] = [0.2, 1.8]

在聚合操作之后，我们将残差连接的结果与原始聚合结果相加：

H2_res = H2 + mean([H1_res_relu1, H1_res_relu2, H1_res_relu3, H1_res_relu4, H1_res_relu5, H1_res_relu6, H1_res_relu7, H1_res_relu8, H1_res_relu9, H1_res_relu10])
       = [0.36, 0.64] + mean([[0.2, 1.8], [1.5, 0.3], [1.7, 2.1], [0, 0], [1.5, 0.3], [0.2, 1.8], [1.7, 2.1], [0, 0], [1.5, 0.3], [0.2, 1.8]])
       = [0.36, 0.64] + [0.98, 1.06]
       = [1.34, 1.70]

对残差连接的结果应用ReLU激活函数：

H2_res_relu = ReLU(H2_res) = [max(0, 1.34), max(0, 1.70)] = [1.34, 1.70]

这样，我们就完成了征进行线性变换和聚合的计算过程，并引入了残差连接。同时，我也计算出了每层的隐藏层结果和残差网络的计算结果。请注意，这只是一个示例，实际应用中可能会有更复杂的计算过程和不同的残差连接方式。

简要说明一下网络结构

我们可以使用如下的线条图表示：

输入层：函数输入 (X) [数量: N]
    |
图卷积层1：[神经元数量: K1]
    |
残差连接
    |
图卷积层2：[神经元数量: K2]
    |
全连接层：[神经元数量: K3]
    |
输出层：函数输出 (Y) [数量: M]

其中，N表示函数输入的数量，K1、K2和K3分别表示图卷积层1、图卷积层2和全连接层中的神经元数量，M表示函数输出的数量。
网络的输出案例可以参考：GNN完整流程