目前 GraphScope 发布了 graphscope-notebook 插件,通过交互式的方式帮助用户在 Jupyterlab 环境下完成图数据的构建和载入操作,极大地降低了载图的复杂度和出错率。本文将详细介绍该插件的使用流程。
背景
对于任何一款图计算产品而言,图数据的载入操作往往是第一步,同时也是比较重要且十分复杂的一步,这其中主要的原因是图数据本身的复杂性。因此,为了提升用户的载图体验,GraphScope 内置了多种数据集,例如对于 TinkerPop Modorn Graph 图而言,用户只需要一条语句即可完成载图操作:
from graphscope.dataset import load_modern_graph
modern_graph = load_modern_graph()
然而,对于用户自定义的数据集来说,载图过程却需要定义一段很长的代码,我们以 ogbn-mag 这张属性图为例:
图中包含了 4 种类型的顶点和 4 种类型的边,其中每种边都有一个标签(label),并且边两端顶点的标签也是固定的,通常每种类型的顶点、边都对应一个 csv 数据文件。