论文阅读：SCARA: Scalable Graph Neural Networks withFeature-Oriented Optimization

最新推荐文章于 2025-04-29 12:24:11 发布

Doehong

最新推荐文章于 2025-04-29 12:24:11 发布

阅读量168

点赞数

文章标签：论文阅读论文笔记

本文链接：https://blog.csdn.net/Doehong/article/details/132864773

版权

1 INTRODUCTION

基本就是笑GCN无谋，GAT少智（算不了大图）

贡献：提出了SCARA这个算大规模graph的近线性的算法

2 PRELIMINARIES AND RELATED WORKS

Post-Propagation Model.

前面的层只有不同特征之间的交互，只有最后一层才会在不同节点之间传播feature。APPNP等中应用。

Pre-Propagation Model.

SGC等算法中采用。第一层传播，后面的层不再传播。

3 SCARA FRAMEWORK
3.1 Overview

对于大规模图的计算，最大的成本之一在传播阶段。这篇论文采用了第二种先传播方式。传播公式如下。我的理解整个论文主要就是在Pre-Propagation里面，用了一个新的高效方式来计算P。主要思想是用一个快速的PPR计算方式计算出一部分feature的PPR传播结果，然后作为基，用这些基去近似其他的feature的PPR传播结果。

3.2 Feature-Push

对特征进行类似PPR的传播。这里是对不同节点每个相同维度的特征进行PPR传播，这里对大残差值的用push方式，对小的用蒙特卡洛采样的方式。在本论文中这个是用来计算基PPR和残差PPR的。是个比较新的PPR算法，是17年kdd的篇成果。

3.3 Feature-Reuse

这一节就是这篇文章的主要新颖的思路。利用一些基去近似其他的特征PPR传播结果。我的理解是这依赖与朴素的思想。如果两个特征具有一定程度的相似性，那么他们传播的结果可能也很相似。本文的近似思路比较朴素。就是多项式近似。下面以论文中一个例子解释：

假设b是一个基𝒃 = (0.5, 0.5)，需要计算的PPR 𝒙 = (0.4, 0.6)。显然可以讲需要计算得到x进行分解
𝒙 = (0.4, 0.4) + (0, 0.2)。x = 0.8𝝅 (𝒃)+(0, 0.2)。(0, 0.2)为残差，b为基，这个𝝅 (.)在我理解中就是b这个基进行了PPR值的计算之后的结果，这个最终结果，表示在b这个特征上，不同节点的一个相似程度。就是基于这个思路设计了如下算法2