关闭

《图数据库》(人民邮电出版社)读书笔记一、二

标签: 读书笔记数据库数据
519人阅读 评论(0) 收藏 举报
分类:

学习比较流行的图数据库~

第一章 简介

现在最流行的图模型形式——带标签的属性图(labeled property graph)


将图领域划分成以下两部分:
主要用于联机事务图的持久化技术,通常直接实时地被应用程序访问。这类技术称为图数据库。
主要用于离线图分析的技术,通常按一系列步骤执行。这类技术称为图计算引擎,与其他大数据分析技术看做一类。


主流的图模型有3种:属性图,资源描述框架(Resource Description Framework,RDF)三元组,超图。


图数据库管理系统是一种在线的数据库管理系统,它支持对图数据模型的增、删、改、查(CRUD)方法。


第二章 关联数据的存储选择

对大多数NoSQL数据库来说,一种广为人知的添加联系的策略是在某个聚合数据(aggregate)中嵌入另一个聚合数据标识符,即添加外键。这需要在应用层连接聚合数据,其代价极速增加。


多数聚合存储只是以内嵌映射结构的方式装饰在聚合数据之内。


聚合存储并不维护关联数据的一致性,也不提供免索引邻接(index-free adjacency),即元素直接与其邻居相连。


Riak中的指针(Link)和查找(Walking):
Riak键值存储引擎允许使用指针(Link)元数据去扩展每个存储的值。指针都是单向的,从一个存储的值指向另一个。Riak允许查找(Walk)(Riak术语)任何数量的指针,从而一定程度上将数据模型关联起来。然而,Riak的指针查找是通过map-reduce驱动的,这一定程度上会有延迟。与图数据库不,这种指针的连接仅适用于简单的图结钩编程,对于通用的图算法就不适用了。


补:元数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元数据的一种应用,是1995年2月由国际图书馆电脑中心(OCLC)和美国国家超级计算应用中心(National Center for Supercomputing Applications,NCSA)所联合赞助的研讨会,在邀请52位来自图书馆员、电脑专家,共同制定规格,创建一套描述网络上电子文件之特征。
元数据是关于数据的组织、数据域及其关系的信,简言之,元数据就是关于数据的数据。


图数据库对于同一个查询提供恒定的查找顺序。增加反向指针会反规范化存储模型。


聚合数据没有局部性这个概念,它不像图数据库那样通过真实的(而不是具体化的)联系自然地提供免索引邻接。


图中的关系自然地形成了路径。查询图或是遍历图都涉及路径。由于从根本上说,数据模型是面向路径的,多数基于路径的图数据库的操作都与数据模型本身呈现高度一致性,因此它们极为高效。


最流行的表示地理坐标的结构被称为R树,是描述有边界区域的类图索引。


图数据库是处理复杂的、结构可变的、密集关联的数据的最好的技术。

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:30336次
    • 积分:1573
    • 等级:
    • 排名:千里之外
    • 原创:130篇
    • 转载:38篇
    • 译文:0篇
    • 评论:4条
    最新评论