文献阅读（80）arXiv2023-Less Can Be More: Unsupervised Graph Pruning for Large-scale Dynamic Graphs

学徒刘猛

于 2023-09-13 15:49:27 发布

阅读量220

点赞数

分类专栏：文献阅读文章标签：机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CSDNTianJi/article/details/132855957

版权

文献阅读专栏收录该内容

87 篇文章 32 订阅

订阅专栏

本文是对《Less Can Be More: Unsupervised Graph Pruning for Large-scale Dynamic Graphs》一文的总结，如有侵权即刻删除。

朋友们，我们在github创建了一个图学习笔记库，总结了相关文章的论文、代码和我个人的中文笔记，能够帮助大家更加便捷地找到对应论文，欢迎star~

Chinese-Reading-Notes-of-Graph-Learning

更多相关文章，请移步：文献阅读总结：网络表示学习/图学习

Title

《Less Can Be More: Unsupervised Graph Pruning for Large-scale Dynamic Graphs》

——arXiv 2023

Author: 李金膛

总结

文章提出了STEP算法，用来解决大规模图学习中的存储空间占用问题。文章指出，当前方法在处理大规模图数据时，往往将其切分为多个子图，而存储这些子图会带来额外的内存占用问题。因此一些研究者开始研究对大规模图的剪枝，以减少内存占用。然而，目前对大规模图的剪枝还停留在静态图上，没有关注图上的动态信息，且很少适用于无监督场景。STEP算法主要关注于时序图数据，并能够在无监督场景下训练运行。其实际效果如下：

在这里插入图片描述

1 问题定义

文章中使用的图数据为时序图，即连续时间动态图（Continous-Time Dynamic Graphs，CTDG），这与离散时间动态图的主要区别在于，按照事件/交互到来的先后顺序存储数据成邻接表的形式，而非图结构。

图剪枝的目的在于，删除图中冗余或不必要的边，在不影响模型效果的情况下能够尽可能地提升训练效率和减小内存需求。

STEP模型可分为三部分：（1）图嵌入网络；（2）图采样网络；（3）无图的剪枝网络。

2 图嵌入网络

模型在剪枝前，需要生成节点嵌入来实现剪枝概率的计算。节点嵌入的生成使用的是常见的GNN结构，即基于图上消息传递的信息聚合方式：

在这里插入图片描述

该模型结构可以参考GraphSAGE，假设共有K层，那么最后一层的输出即为节点嵌入。

应当注意，STEP模型关注的是图上的剪枝问题，即裁剪去多余的边，那么在得到节点嵌入后就可以进一步计算得到边的嵌入：

在这里插入图片描述

边的嵌入由四部分拼接而来，节点i和j的嵌入，边上的原始特征，边上的时间信息。其中，这一时间信息并非直接利用时间戳，而是通过计算时间差值得到：

在这里插入图片描述

3 图采样网络

在得到边的嵌入后，可以根据其嵌入来计算相应的裁剪概率。文章认为一条边（交互）的裁剪概率主要考虑两方面，首先是冗余程度（redundancy），此外是相关程度（relevance）。

在这里插入图片描述

关于冗余度的计算，可以理解为一条边与其他边越相似，意味着越能被其他边代替，就越冗余。

而在计算相关度时，文章首先计算了全图的表征，即：

在这里插入图片描述

通过衡量边与全图表征的相关程度，就能来判断这条边在整个图中是否重要：

在这里插入图片描述

而后，该条边的裁剪概率可计算如下：

在这里插入图片描述

此外，文章还指出，以往的裁剪概率都是一个离散的值，即有多大的可能性会被抛弃。然而，这种概率值是不可微的，即无法随着模型优化。因此，文章对该概率进行了进一步改进，使得其可微：

在这里插入图片描述

4 无图的剪枝网络

文章还指出，上述模块虽然能够很好地对现有图结构进行裁剪，但对于新到来的节点交互，显得不够灵活。因此，文章提出了无图的剪枝网络，即不需要依赖图结构就能决定该条边是否应当裁剪。具体来说，其裁剪概率会根据边的原始特征和交互时间差来计算得到：

在这里插入图片描述

5 损失函数

模型的损失函数可以分为三部分，首先是主损失函数，对比损失。该部分用来缩小原始图数据得到的全图嵌入和裁剪图数据得到的全图嵌入之间的差距：

在这里插入图片描述

其次，是自蒸馏损失，该损失用来优化无图的剪枝网络模块，用图采样模块计算出的概率与其预测的概率进行比对，来使得剪枝更加有效：

在这里插入图片描述

最后是正则化项。文章指出尽管假设图结构遵循伯努利分布，并利用具体分布来近似采样过程，但在训练过程中并不总是保证这样的约束，即得到的分布可能会偏离期望的伯努利分布。因此，文章提出了伯努利矩匹配，通过将分布均值和方差与离散概率分布伯努利(𝑞)进行匹配来拟合采样边的分布:

在这里插入图片描述

最终的损失函数即由以上三部分构成：

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
文献阅读（80）arXiv2023-Less Can Be More: Unsupervised Graph Pruning for Large-scale Dynamic Graphs

本文是对《Less Can Be More: Unsupervised Graph Pruning for Large-scale Dynamic Graphs》一文的总结，如有侵权即刻删除。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。