知识图谱初探(十)- 图数据库中的分布式及切图

本文探讨了分布式系统的基本问题,包括数据副本和数据切分,并着重讲解了图数据库的切分策略,如切边法和切点法。同时,文章提到了负载均衡挑战,尤其是处理超级节点的问题。最后,介绍了nebula图数据库的设计,其采用存储层和计算层分离,使用一致性哈希进行切分,并通过B+tree结构处理超级节点,实现负载均衡。
摘要由CSDN通过智能技术生成

图数据库中有单机版,也有支持分布式。如果需要构建的图超过单机所能存储的上限,那么分布式就时必须的了。

分布式系统的基本问题

对于分布式系统来说,需要解决以下基本问题:数据副本,数据切分。
对于单机系统来说,数据副本很好理解:启动多个节点作为备份,一个主节点,多个备份节点,此时数据副本可以等同于备节点。
对于分布式系统,通常来说需要有以下表现:

  1. 数据存储以数据块为基本单元,一个数据块包含多条数据,通常以固定大小为一块,如:64MB,4KB等
  2. 一个节点可以存储多个数据块,每个数据块存储于多个节点
  3. 单节点故障,可以通过其他节点恢复数据,不会导致数据缺失
  4. 数据块与备份之间的数据一致性
  5. 节点的横向扩展,随时增加减少节点
  6. 合理的数据切分方式,使得数据写入时准确的切割和读取时再次组装

图数据库的切分

与关系数据库相比,图数据库的一个特点是:整个图是一个整体。如:人类社会关系图,前面构建的三体人物关系图,每个节点都会存在于该图中,每个节点都将于其他节点通过不同边相连,通常我们关注的是点与点之间的联系,而非孤立的某个点。
如此,对于图数据库,我们不同简单的以点id或者边id来做切分,分散存储在不同节点,因为需要尽量将一次图查询在一个节点中完成,而不是跨整个集群去查询。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值