1.3 图数据库与其他 NoSQL 数据库的对比
为了克服关系数据库在大型企业级应用中的弊端, NoSQL 数据库逐渐流行起来。 NoSQL 数据库专注于解决大规模数据集合、多重数据种类带来的挑战,尤其是大数据应用难题。同时 NoSQL 数据库的多样化也提供了多种不同的数据模型解决方案,每个解决方案都可以应用到不同的项目用例中。显然, Neo4j 就是 NoSQL 中可以提供图数据模型的典型代表。
1.3.1 其他 NoSQL 数据库的弊端
目前大部分 NoSQL 类数据库的数据存储形式都是基于集合的,数据按照集合被划分开,比如文档数据库中的文档。 NoSQL 数据库的数据存储在不连贯的集合中,这使得数据之间的相互连接、建立关系变得困难。
要实现类似关系数据库的外键功能,通常人们会将某个数据集合直接嵌入到另一个数据集合中来实现两者之间的从属关系,但很明显这样创建数据集合之间的关系要付出很大的存储开销。
分类 | 数据类型 | 优势 | 劣势 | 典型应用场景 |
---|---|---|---|---|
键值数据库 | 哈希表 | 查找速度快 | 数据无结构化,通常只被当作字符串或者二进制数据 | 内容缓存,主要用于处理大量数据的高访问负载,也用于一些日志系统等 |
列存储数据库 | 列式数据存储结构 | 查找速度快,支持分布横向扩展,数据压缩率高 | 功能相对受限 | 分布式文件系统 |
文档型数据库 | 键值对扩展 | 数据结构要求不严格,表结构可变,不需要预先定义表结构 | 查询性能不高,缺乏统一的查询语法 | Web应用 |
图数据库 | 节点和关系组成的图 | 利用图结构相关算法。比如最短路径,节点度关系查找等 | 可能需要对整个图做计算, 不利于图数据分布存储 | 社交网络、 推荐系统、意向图、消费图、兴趣图、关系图谱等 |
分类 | 性能 | 可扩展性 | 灵活性 | 复杂性 | 功能性 |
---|---|---|---|---|---|
键值数据库 | 高 | 高 | 高 | 无 | 可变(无) |
列存储数据库 | 高 | 高 | 一般 | 低 | 很少 |
文档型数据库 | 高 | 可变(高) | 高 | 低 | 可变(低) |
图数据库 | 可变 | 可变 | 高 | 高 | 图论 |
关系数据库 | 可变 | 可变 | 低 | 一般 | 关系代数 |
1.3.2 将键值对存储与图数据库相关联
如下图所示,键值(Key-Value)存储数据库,其数据按照键值对的形式进行组织、索引和存储,类似 Java 中的 map ,它适合不涉及过多数据关系的应用。因为能有效减少读写磁盘的次数,所以其性能非常高。
如果将这些键值对相互关联,就可以得到一个图结构。通过这个图结构,可以表达数据之间的复杂关系,如下图所示。
1.3.3 将文档存储与图数据库相关联
文档存储的层次化结构可容纳许多无模式的数据,可以轻松地将数据存储为树状结构。虽然树也是一种图形,但树只能表达从下到上的从属关系,如下图所示。
在树状存储结构中总会出现多次被嵌入的冗余数据,这增加了更新数据的困难,同时也难以确保数据的一致性。如果我们将冗余的数据去掉,然后用图结构将存在相互关系的数据相关联,数据冗余的问题就解决了,并且数据之间的关系变得更直观,如下图所示。