ICML'21 GAS：一键将任意GNN扩展到任意大图上

最新推荐文章于 2024-09-20 22:11:52 发布

weixin_45519842

最新推荐文章于 2024-09-20 22:11:52 发布

阅读量131

点赞数

文章标签： js 区块链人工智能 zookeeper spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45519842/article/details/118534574

版权

本文介绍了由PytorchGeometric开发者Matthias Fey等人提出的一种新方法，旨在解决大规模图神经网络(GNN)训练的效率问题。通过保存历史节点表示，避免重复计算，实现GPU资源的常量级消耗。使用PyGAS框架，只需少量代码改动即可实现这一优化，允许GNN在大图上全批处理运行。该方法减少了采样带来的冗余计算，提高了大规模GNN训练的效率。

摘要由CSDN通过智能技术生成

推荐一篇ICML 2021的文章，与之前推荐的ICML'21 1000层GNN！单块GPU即可训练！类似，本文也不是关注于GNN的架构设计，而是希望能够改善大规模GNN的训练问题。

作者包括Matthias Fey(著名的Pytorch Geometric的开发者)和斯坦福Jure等一众大佬。

image-20210705195205701

本文的核心idea是：通过保存历史计算过的节点表示，使得任意GNN可以扩展到任意大图上运行，且GPU消耗为常量。在具体实现时，通过调用本文提供的PyGAS框架，只要修改短短几行代码，即可一键起飞~

下图中的彩色部分为需要修改的所有代码。

image-20210705204338246

介绍

大图上的GNN基本很难以full-batch的形式运行(拿不到完整的邻接矩阵)。目前的解法主要是进行采样，比如逐点采样其局部邻居结构并聚合。

但是在采样聚合过程中，会有很多冗余的计算。比如聚合节点和节点的邻居并学习表示时，节点和会重复计算。

image-20210705204224465

那么一个简单的想法就是：如果和的表示会重复计算的话，那算完的表示直接存下来，下次直接调用就完事了呗。

下图为GAS的计算图，代表上次迭代更新的历史节点表示。可以看出这里的表示没有迭代更新了，而是直接从中取出来。

image-20210705205643777

本文的核心公式如下：

其实就做了一件事，把会重复计算的节点表示用其历史计算过的表示来代替。

更多具体细节欢迎去围观原文。

weixin_45519842

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。