本文介绍 GraphScope 团队与东北大学张岩峰教授团队的学术合作项目,可以高效处理动态大规模图数据的自动增量图分析框架 Ingress。该成果论文 Automating Incremental Graph Processing with Flexible Memoization[1] 发表于 VLDB’2021。
背景
随着图数据的迅速增长,对处理大规模图数据的需求也不断增加,也涌现了各种分布式图处理系统,如 Pregel、PowerGraph、GeminiGraph、GraphScope等。但这些分布式图处理系统大多数基于静态图设计,主要用于分析一些大规模静态图数据。而现实生活中,图数据不仅规模巨大,而且不断发生变化,例如下图的场景中,常发生一些点或者边的增加和删除。
动态图示例:网页链接的添加/删除;交易图中的交易创建/取消;社交图中的好友关注/取消关注
图数据的变化往往会导致图数据分析结果的变化,举个例子,在下图中添加一条从点 b 到点 d 且权重为 2 的边(标红显示),则点 a 到点 f 的最短路径从 5 变为 4。
图数据发生变化导致图分析结果变化
现有的静态图分析系统需要对变化后的图数据需要重新计算,以此来更新图分析结果。频繁地对大规模图数据进行重新分析存在计算开销大和结果更新时延长等问题。