- 概述
本章从数据库之初的数据模型开始介绍(20世纪60年代),从用户使用的角度分析了每种数据模型的优缺点。就目前国内互联网存储来看实际用处并不大,对于互联网分布式存储开发工程师更多的意义是提供了一个全面(发展历程)、笼统的了解数据库的发展。
在数据模型部分介绍了,关系数据模型、文档数据模型并结合一对多、多对多等用户使用方式上进行了比较,原文在本章并没有介绍互联网更看重的性能、扩展性等因素。
在查询语言部分将查询语言分为命令式、声明式,为了介绍更全面的查询语言还介绍了图数据模型(并没有详细介绍实现)。原文认为声明式(SQL)查询语言隐藏了优化细节,同样优化器也是有性能开销,在互联网应用的很多场景性能要求尤为突出时,一些带宽、即少量应用程序的计算负担(命令式缺点)是可以接收的。
- 数据模型
关系型数据模型:一对多关系相比文档数据模型优势不大,多对多比文档数据模型有优势(因为需要应用程序去做级联会影响程序性能)。
文档数据模型:适合一对多关系(局部性很多,得益于数据模型类似json)。
层次数据模型:树状结构每个节点有唯一的父节点(文档模型属于这种)。
- 查询语言
图状数据模型:适合多对多关系,原文引用facebook例子,定点和边分别存储在两个表中。
包括属性图、三元存储两种存储模型。
查询语言:图数据的查询语言包括,Cypher、SQL、SPARQL。其他的查询语言还介绍了MapRedce等。