Approximate Graph Propagation
高效计算节点邻近性查询,如转移概率、个性化PageRank和Katz,在各种图挖掘和学习任务中具有重要意义。最近的几项工作利用快速的节点邻近度计算来提高图神经网络(GNN)的可扩展性。然而,之前关于邻近度计算和GNN特征传播的研究都是在具体案例的基础上进行的,每篇论文都专注于特定的邻近度度量。
本文提出近似图传播(Approximate Graph Propagation, AGP)算法,一种统一的随机化算法,计算各种邻近查询和GNN特征传播,包括转移概率、个性化PageRank、热核PageRank、Katz、SGC、GDC和APPNP。该算法提供了一个理论上有界的误差保证,并且具有几乎最优的时间复杂度。进行了广泛的实验研究,证明了AGP在两个具体应用中的有效性:基于热核PageRank的局部聚类和基于GNNs的节点分类。最值得注意的是,对10亿边的图论文100m进行了实证研究,这是迄今为止最大的公开可用GNN数据集。结果表明,AGP可以在不牺牲预测精度的情况下显著提高各种现有GNN模型的可扩展性。
总结:文中解决了图中节点近邻性查询问题。当前研究主要关注特定的场景,例如,尽管个性化PageRank和热核PageRank之间有相似之处,但这两种接近性度量包含了两套完全不同的算法。
因此采用一种随机化的方法,该方法提供了理论上的上界分析和最优时间分析,具有理论上的保障