JanusGraph Data Model
以下内容来自官网。
JanusGraph采用邻接表存储图,具体的是存储了顶点的邻接表集合。以顶点为key,顶点的邻接表中包含所有的边,顶点属性以及边的属性。
这种存储结构,允许JanusGraph将数据存储在任何支持bigtable的存储后端中。关于bigtable与传统数据库的区别不太了解的请去查看这篇文章。
由于图是完整的包含关系、属性、顶点的,在存储时候需要对图进行分割,常用的分割方法包括:顶点分割,边分割。
- 顶点分割:根据顶点分割,每个边值存储一次。
- 边分割:根据边分割,以顶点为中心,边会存储两次。(Janusgraph以这种方式分割)存储两次能够存储边的方向,方便快速找到对端。
JanusGraph对Bigtable有一个要求:必须按照列对单元格进行排序,并且必须能够有效地检索列范围指定的单元格子集。
使用HBASE作为存储后端时,janusGraph按照Vertex id进行排序,因为HBASE原生的支持键排序。
JanusGraph Data Layout
官网给的janusgraph数据格式如下图所示: