组队学习-图神经网络(fifth)

本文主要分析Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Network论文中提出的新的图神经网络模型以及新的训练图神经网络的训练方法。
一些经典模型如 GCN 采用了 full-batch 的 SGD 优化算法,要计算整个梯度则需要存储所有中间的 Embedding,因此,其是不可扩展的。此外,虽然每个 epoch 也只能更新一次参数。
GraphSAGE 中提出 mini-batch 的 SGD 优化方法,由于每次更新只基于一个 mini-batch,所以内存的需求降低,并在每个 epoch 中可以进行多次更新,从而收敛速度更快。然而,随着层数加深,每个节点的感受野越来越大,其计算单个节点的计算开销也会越来越大。针对这个问题,GraphSAGE 通过使用固定大小的邻居采样,同时 FastGCN 的重要性采样可以一定程度上解决计算开销,但是随着 GCN 的深度加深,计算开销问题依然没法解决。VR-GCN 提出利用方差来控制邻居的采样节点,尽管减少了采样的大小,但是它需要将所有节点的中间 Embedding 存储于内存中,导致其可扩展性较差。
下表是不同模型的时间复杂度和空间复杂度:
在这里插入图片描述
作者在实验中发现mini-batch的算法效率与batch内节点与batch外节点间的连接数量成正比,针对这一现象,作者构建了节点的分区,使同一分区中的节点之间的图连接于不同分区中的节点之间的图连接更多。

为了解决普通方法无法在超大图上做节点表征学习的问题,Cluster-GCN论文提出:

  • 利用图节点聚类算法将一个图的节点划分为c个簇,每一次选择几个组的节点和这些节点对应的边构成一个子图,然后对子图做训练。
  • 由于是利用图节点聚类算法将节点划分为多个簇,所以簇内边的数量要比簇间边的数量多得多。
  • 基于小图进行训练,不会消耗很多内存空间,于是我们可以训练更深的神经网络,从而得到更高的精度。
    我们知道,基于mini-batch的SGD可以在单个epoch中更新多次,从而使得其比full batch具有更快的收敛速度,但是前者每个epoch所
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《离散事件系统模拟第五版》是由Jerry Banks等人合著的一本关于离散事件系统模拟的教材。本书主要介绍了离散事件系统模拟的概念、原理和方法,并提供了大量的实际案例和应用。 这本教材首先介绍了离散事件系统模拟的基本概念,包括模拟的定义、离散事件和连续事件、系统和模型等。然后详细介绍了模拟的建模过程,主要包括问题分析、模型建立、数据采集和验证等步骤。接着,书中介绍了常用的模拟实验设计方法,包括单因素实验设计、多因素实验设计和灵敏度分析等。此外,本书还介绍了一些高级的模拟技术,如模态建模、代理的应用等,以及与仿真相关的统计分析方法。 《离散事件系统模拟第五版》的特点之一是实例丰富。书中提供了大量的实际案例和应用,涵盖了不同领域的模拟问题,如生产调度、物流管理、服务系统优化等。这些实例不仅有助于读者理解模拟的概念和方法,还帮助读者将模拟技术应用于实际问题解决中。 此外,本书还提供了大量的习题和案例分析,用于巩固读者对于离散事件系统模拟的理解和应用能力。书中还介绍了一些常用的模拟工具和软件,如Simul8、AnyLogic等,帮助读者更好地进行模拟实验。 总之,《离散事件系统模拟第五版》是一本全面介绍离散事件系统模拟的教材,既系统性地介绍了模拟的概念和建模方法,又通过实例和习题帮助读者理解和应用模拟技术。这本教材对于学习和研究离散事件系统模拟的读者来说是一本重要的参考书。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值