JanusGraph数据模型(存储结构）_janugraph数据存储结构-CSDN博客

JanusGraph采用邻接表存储图，每个顶点的邻接表包含所有边及属性。存储结构允许其在支持bigtable的后端中存储数据。JanusGraph通常采用边分割方法，每个边存储两次以保存方向。数据布局中，每个邻接表作为一行存储，Edge和Property以单元格形式存在于Vertex的邻接表中，通过序列化技术减小存储空间。

摘要由CSDN通过智能技术生成

JanusGraph Data Model

以下内容来自官网。

JanusGraph采用邻接表存储图，具体的是存储了顶点的邻接表集合。以顶点为key,顶点的邻接表中包含所有的边，顶点属性以及边的属性。

这种存储结构，允许JanusGraph将数据存储在任何支持bigtable的存储后端中。关于bigtable与传统数据库的区别不太了解的请去查看这篇文章。

由于图是完整的包含关系、属性、顶点的，在存储时候需要对图进行分割，常用的分割方法包括：顶点分割，边分割。

顶点分割：根据顶点分割，每个边值存储一次。
边分割：根据边分割，以顶点为中心，边会存储两次。（Janusgraph以这种方式分割）存储两次能够存储边的方向，方便快速找到对端。

JanusGraph对Bigtable有一个要求：必须按照列对单元格进行排序，并且必须能够有效地检索列范围指定的单元格子集。

使用HBASE作为存储后端时，janusGraph按照Vertex id进行排序，因为HBASE原生的支持键排序。

JanusGraph Data Layout

官网给的janusgraph数据格式如下图所示：

在这里插入图片描述

JanusGraph将每个邻接表作为一行存储在底层存储后端。顶点id (JanusGraph唯一分配给每个顶点)是指向包含顶点邻接表的行的Key。每个边和属性都存储为行中的单个单元格，以便进行有效的插入和删除。因此，在特定存储后端中每行允许的最大单元格数也是JanusGraph可以针对此后端支持的顶点的最大程度。