基本概念
图数据库(Grahp Database)是基于图论实现的一种新型NoSQL数据库,它的存储结构和数据的查询方式都是以图论为基础的,图论中图的基本元素为节点和边,在图数据库中对应的就是节点和关系。
在图数据中,数据与数据之间的关系通过节点和关系构成一个图结构并在此结构上实现数据库的所有特性,具有传统数据库的所有功能。
与传统的关系数据库相同,图数据库的核心也是构建在一个引擎之上的,就是图计算引擎,图计算引擎是能够组织存储大型图数据集并且实现了全局图计算算法的一种数据库核心构建。
目前较为流行的图计算引擎有两种:单机图计算引擎和分布式图计算引擎
单机图计算引擎的典型代表是Cassovary,Cassovary是一个用scala编写的基于java虚拟机的图计算引擎,在twitter上Cassovary用来为其提供基于图的功能。
分布式图计算引擎的典型代表是pegasus和giraph,pegasus是一个运行在hadoop云计算平台之上的分布式图计算引擎,最初他是为了google的网页数据处理而设计出来的。
图数据库与关系数据库的对比
关系数据库的弊端
关系数据库自上世纪80年代以来一直是数据库领域发展的动力,并持续到今天。他们两高度结构化的数据存在在一张二维表中,并且数据组织的特性严格,在关系型数据库中,通过外键约束来实现两表或多个表之间某些记录的相互引用关系,外键约束是关系数据库中实现两表之间相互引用必不可少的策略。但这种关系匹配的操作,会消耗大量系统的资源,如果使用多对多的关系,则必须通过增加中间表来建立一对一的联系,这相同的增加了操作成本。
图数据模型的优势
在图数据库中ÿ