图神经网络 GNN 入门

最新推荐文章于 2023-12-31 23:19:21 发布

dongmie1999

最新推荐文章于 2023-12-31 23:19:21 发布

阅读量695

点赞数 1

文章标签：神经网络人工智能深度学习

本文链接：https://blog.csdn.net/dongmie1999/article/details/131230841

版权

参考链接

A Gentle Introduction to Graph Neural Networks (distill.pub)

零基础多图详解图神经网络（GNN/GCN）【论文精读】_哔哩哔哩_bilibili

图的基本构成

边又可分为有向边和无向的

顶点、边和全局（master node）可能有多个属性，如下图

图的表示方法

邻接矩阵法：

矩阵的的横纵坐标是所有的顶点，对应两个点之间记录边的情况（边的权重、边的指向）等；
有n和顶点，邻接矩阵就是 n*n 的；
如果 n 很大，对应的图的邻接矩阵也会很大
邻接矩阵通常是很稀疏的，想要高效存储同时做高效计算很难

邻接列表：

维护三个矩阵，分别存储顶点属性、边属性和边的关系
只存相连接的边

图的示例

下面给出了一些可建模成图网络的数据，除了上面的图片，自然语言文本、人物关系也可以建模成图网络

注意，一个数据可能对应不同的邻接矩阵

一些常见图网络的数据规模

图网络的基本任务

图网络的输入是一个图网络，输出是一个拓扑结构相同的图网络；输入输出的属性可能会有所不同

1、全局级别的，如给定一个分子式的图网络结构，预测该分子的属性（气味、颜色等，或者该图网络中是否包含两个环）

2、节点级的，如对图网络中的节点做分类（人物属性预测）

3、边级别的，如对图网络中的边进行预测（人物关系预测）

图网络的处理

上面说过，图网络的输入是一个图网络，输出是一个拓扑结构相同的图网络；输入输出的属性可能会有所不同

那基本的方法就是对顶点、边和全局属性分别单独做变换（过全连接层），得到输出的图

上面的图网络处理只考虑了，也可以对输入的缺失属性做补全，如用顶点预测补全边，或者用边预测补全顶点；

或者对顶点和边之间的信息做融合后再过券还能连接网络

影响图网络效果的超参数

跟其他基于学习的模型一样，受到下列参数的影响

学习率（learning rate）：学习率决定了每次参数更新的步长大小，过大的学习率会导致模型不稳定过小的学习率会导致收敛速度慢
批大小（batch size）：批大小决定了每次训练时输入模型的样本数量，过小的批大小会导致模型难以优化，过大的批大小会占用过多计算资源
正则化项（regularization）：在损失函数中添加正则化项来限制模型的权重，防止过拟合
网络层数（number layers）：神经网络层数的选择需要考虑模型的复杂度和有效性，过多的层数会增加训练难度和计算开销，过少的层数会影响模型表达能力
激活函数（activation function）：激活函数用来引入非线性因素，提高模型的表达能力和性能，不同的激活函数适用于不同的场景
优化器（optimizer）：优化器决定了参数更新的方式，不同的优化器适用于不同的任务，如 Adam、SGD 等
模型结构（model architecture）：模型结构的选择需要综合考虑数据特征和任务需求，如图卷积网络、深度学习网络等
正则化项（regularization）：在损失函数中加入正则化项，如 L1 或 L2 正则项等，可有效防止过拟合
随机正则化策略：通过类似 dropout 的随机正则化方式，可以减少 GNN 的过拟合风险

同时，图网络还受到下列图相关的参数的影响

图结构的表示方式：图可以用多种方式来表示，例如邻接矩阵、邻接表、边列表等。选择适合特定任务的图构表示方式可以提高模型的效果
图卷积神经网络的层数和跨层连接方式：GCN可根据具体任务的特点设计合适的层数和跨层连接方式
聚合方式（aggregation）：对于每个节点，GCN采用邻域节点的特征值来计算新的节点特征。这里可以采用不同的聚合方式，例如平均聚合、最大聚合等
权重共享策略：GCN中可以在同节点间共享权重，这种策略可以有效减少需要训练的参数数量

图网络的评价指标

准确率、召回率，和通过混淆矩阵算得的 F1 Score 等
AUC-ROC：评估二分类模型的准确性，可以评估模型在不同阈值下的性能。
平均精度均值（mAP）：用于评估排序模型（比如谱聚类、社区发现等）的性能。
正确率代价曲线（Precision-Recall curve）：显示不同阈值下的模型的准确率和召回率，可以用于评估模型性能。
迁移学习效果：用于评价将已经学习过的知识迁移到新任务的准确性。
训练时间和模型大小：对实时应用、移动设备等有限资源的场景，需要考虑模型大小和训练时间等因素。

下一篇介绍异构图、超图等其他图

dongmie1999

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
图神经网络 GNN 入门

网络层数（number layers）：神经网络层数的选择需要考虑模型的复杂度和有效性，过多的层数会增加训练难度和计算开销，过少的层数会影响模型表达能力。批大小（batch size）：批大小决定了每次训练时输入模型的样本数量，过小的批大小会导致模型难以优化，过大的批大小会占用过多计算资源。1、全局级别的，如给定一个分子式的图网络结构，预测该分子的属性（气味、颜色等，或者该图网络中是否包含两个环）上面说过，图网络的输入是一个图网络，输出是一个拓扑结构相同的图网络；输入输出的属性可能会有所不同。
复制链接

扫一扫