mysql存储图graph_图解图库JanusGraph系列-一文知晓“图数据“底层存储结构

最新推荐文章于 2024-07-10 00:25:13 发布

三叔侃侃

最新推荐文章于 2024-07-10 00:25:13 发布

阅读量1k

点赞数

文章标签： mysql存储图graph

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_28913019/article/details/113195410

版权

本文详细解析了JanusGraph如何存储图数据，包括图的存储模式（邻接列表）、图切割方式（Vertex Cut和Edge Cut）、BigTable模型以及存储逻辑结构。JanusGraph基于BigTable数据模型实现邻接列表，使用节点ID作为HBase的Rowkey，通过节点ID、属性和边的结构来组织数据。同时，文章讨论了分布式唯一ID的生成机制和Schema的使用。

摘要由CSDN通过智能技术生成

知识是永远的流行色!

码友们，点赞再看，养成好习惯~

一：存储模式

留言或私信我，邀请你加入“图数据库交流”微信群！

1、图内容

本文以下所有内容基于：JanusGraph基于属性图来进行构造图数据：

属性图：属性图是由顶点(Vertex)，边(Edge)，属性(Property)组成的有向图

Vertex可以包含Properties；Edge也可以包含Properties；

2、存储方法

图存储的方式常用的有两种：邻接列表和邻接矩阵

JanusGraph采用邻接列表进行图数据的存储，如下图所示：(此处将图中节点抽象为只有节点，没有属性)

在Janusgraph中一个顶点的邻接列表包含该节点对应的属性和关联的边，下述会详细说明 Janusgraph中邻接列表是如何实现的；

3、图切割方式

图的切割方式分为两种：按节点切割(Vertex Cut)和按边切割(Edge Cut)

Vertex Cut：根据点进行切割，每个边只存储一次，只要是节点对应的边便会多一份该节点的存储

Edge Cut：根据边进行切割，以节点为中心，边会存储两次，源节点的邻接列表存储一次，目标节点的邻接列表存储一次

在Janusgraph中既存在Edge Cut，也存在Vertex Cut的情况；

在默认的情况下使用边切割，而针对热点节点可以通过配置makeVertexLabel('product').partition()来将节点类型为product类型的节点进行Vertex Cut；

也就是说，在没有上述makeVertexLabel('product').partition()配置的话，JanusGraph所有的图数据都是以Edge Cut的方式来进行切割存储的；

具体可以查看文章：《JanusGraph-分区》中自定义分区部分中关于图切割部分的介绍；

我们例子来说明一下：

如下图：张三用户节点通过手机号关联出来李四用户节点

张三和李四代表Vertex；指向的name、age、gender代表张三的属性

edgeA 和edgeB 代表Edge；也可以包含边的属性，例如下图中边包含属性create_time

按边切割后：

节点

张三

name(property)

age(property)

gender(property)

edgeA(edge)

phone

phone(property)

edgeA(edge)

edgeB(edge)

李四

name(property)

age(property)

gender(property)

edgeB(edge)

上述可以看到，按照边切割后每一条边会存储两次！

二：BigTable模型

在JanusGraph的存储中， JanusGraph将图形的邻接列表的表示存储在支持Bigtable数据模型的任何存储后端中

BigTable模型如下图：

在Bigtable数据模型中，每个表是行的集合，由一个key唯一标识。

每行由任意(可以很大数量但是必须有限数量)数量的cell组成；cell由column和value组成，column唯一标识某一个cell。

上述图中，有两部分需要排序的支持：sorted by key 和 sorted by column：

sorted by key：标识存储后端存储的数据时按照key的大小进行排序存储的

sorted by column：这是JanusGraph对Bigtable数据模型有一个额外要求，存储edge(边)的单元格必须按column排序，并且列范围指定的单元格子集必须是有效可检索的；这句话详细解答在下述文章中有体现

在Bigtable模型中的行称为“宽行”，因为它们支持大量cell，并且不必像关系数据库中那样预先定义这些cell的column。

在关系型数据库中我们必须先定义好表的schema，才可以存储数据，如果存储过程中想要改变表结构，则所有的数据都要对变化的列做出变化。但是Bigtable模型存储中就不必如此，每个行的column不同，我们可以随时仅对某一行进行变化，也不许预先定义行的schema，只需

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。