本文主要介绍 GraphScope 图学习引擎 GraphLearn 最新推出的面向 GNN 在线推理任务的动态图采样服务。
GraphScope 通过 GraphLearn 提供工业级图神经网络解决方案。在最新的 GraphLearn 版本中,我们推出了面向 GNN 在线推理任务的动态图采样服务(Dynamic-Graph-Service, DGS)。DGS 具备实时处理高吞吐图更新的能力,并能保证低时延、高并发的推理采样查询处理,其图更新和采样查询性能在分布式环境下线性可扩展。
背景介绍
目前工业界主流 GNN 算法(例如 GraphSAGE)都是基于静态图进行建模训练。然而在很多实际业务场景中,模型训练和下游推理预测需要能够实时捕捉图结构和属性的动态变化,因而产生了面向动态图的训练和推理的需求。
根据动态图数据建模的不同,动态图 GNN 模型大体上可以分为两类,即离散动态图(DTDG)模型(EvolveGCN、HGT等)和连续动态图(CTDG)模型(TGAT、TGN、APAN等)。离散动态图模型中,动态图会被按照一定时间粒度进行切分,每个切分会产生相应的图快照,反映该时刻图的状态,并通过多个离散的静态图组成的序列来表示图的动态变化。DTDG 的一个关键优势在于可以以相对直接的方式接入基于静态图的图神经网络算法,但因为快照粒度的原因存在数据丢失的可能性。相比之下,CTDG 保存了图中发生的所有变化和相应的时序信息。基于 CTDG 的连续动态图模型针对这些时序变化对图数据进行组织建模和训练,从而使模型可以在最细粒度捕捉到图中发生的变