目录
12. 数据库发展和新技术
12.1 本章重点
每年考的点不多,但是本章内容繁多,基本按照考点去复习就差不多了,其他的按个人需要翻一翻。
12.2 分布式数据库
分布式数据库系统是针对面向地理上分散,而管理上有需要不同程度集中管理的需求而提出的一种数据管理信息系统。
分布式数据库系统首先是由多个不同节点或场地的数据库系统通过网络连接而成的,每个节点都有各自的数据库管理系统,同时还有全局数据库管理系统。
分布式数据库系统作为一个整体,应该保证数据的一致性,也就是各个局部数据库之间应该具有逻辑相关性,完全分布式数据库系统应该满足的条件如下:
(1)分布性:数据存储在多个不同的节点上;
(2)逻辑相关性:数据库系统内的数据在逻辑上具有相互关联的特性;
(3)场地透明性:使用分布式数据库中的数据时不需指明数据所在的位置;
(4)场地自治性:每一个单独的节点能够执行局部的应用请求。
分布式数据库的特点:(理解并记住)
(1)数据的集中控制性:能够对信息资源提供集中控制,是主张采用数据库最强有力的动机之一。全局数据库管理员负责管理所有数据库,局部数据库管理员只负责格子节点的局部数据库。
(2)数据独立性:是指数据的组成对应用程序来说是透明的,应用程序只需要考虑数据的逻辑结构,而不用考虑数据的物理存放,数据在物理组织上的改变不会影响应用程序。
(3)数据冗余可控性:多场地保存同一数据,节省查询中的传输开销,数据的多个副本也提高了系统的可用性,这种冗余是在系统控制之下的,所以给喜糖造成的不利影响是可控制的。
(4)场地自治性:分布式数据库系统的所有用户可以使用全局数据库,也允许用户只用本地的局部数据库(局部应用),局部应用独立于全局应用的特性就是局部数据库的自治性,由于自治性,对每个场地来说就有两种数据:一种是参与全局数据库的局部数据,而另一种则是不参与全局数据库的数据。
(5)存取的有效性:分布式数据库系统中的全局查询分解为等效的子查询,因为查询优化分为全局优化和局部优化。
分布式数据库的模式结构:
这是一条懒癌患者放弃治疗线(画不出比书本更美的图了,原图奉上)
四层模式具体的内容参详书本P-537。
分布式数据库系统故障分为:介质故障、系统故障、事务故障、网络分割故障、报文故障。
12.3 决策支持系统和数据库
决策支持系统由下列的子系统组成:
(1)数据库子系统:包括数据库,其中包含关于决策问题的有关数据,并由数据库管理系统管理;
(2)模型库子系统:包括模型库,其中包含财务、统计、管理科学或其他定量模型,可提供系统的分析功能,由模型库管理系统为用户提供建模语言以及模型库管理功能;
(3)人机交互系统:通过该子系统,用户与决策支持系统通信并使用决策支持系统,协调和控制数据库子系统和模型库子系统的管理和运行。
数据仓库的数据具有四个基本特征:面向主题的、集成的、不可更新的、随时间不断变化的。
联机分析处理(OLAP)是针对特定问题的联机数据访问和分析。OLAP是以数据仓库进行分析决策的基础,针对特定问题的联机数据访问和分析,OLAP能够对不同数据集合进行基于某个或是多个角度的比较,它能够从不同角度切割数据集合从而进行分析。
联机事务处理(OLTP)是是操作人员和低层管理人员利用计算机网络对数据库中的数据进行查询、增加、删除、修改等操作,已完成事务处理工作。OLTP以快速事务响应和频繁的数据修改为特征,用户利用数据库快速地处理具体业务,OLTP应用时有频繁的写操作,所以数据库要提供数据锁、事务日志等机制。
OLTP和OLAP对比表说:
12.4 非关系型数据库NOSQL
12.4.1 CAP理论和BASE理论
CAP理论是:简单地说,就是对于一个分布式系统,一致性、可用性和分区容忍性三个特点最多只能三选二。
(1)一致性:指系统在执行了某些操作后仍处在一个一致的状态,这点在分布式的系统中尤其明显。比如某用户在一处对共享的数据进行了修改,那么所有有权使用这些数据的用户都可以看到这一改变,简言之,就是所有的节点在同一时刻有相同的数据。
(2)可用性:指数据的所有操作都应有成功的返回,高可用性则是在系统升级(软件或硬件)或在网络系统中的某些节点发生故障的时候,仍可以正常返回,简言之,就是任何请求不管成功或失败都有响应。
(3)分区容忍性:这个概念的前提是网络发生故障,在网络连接上,一些节点出现故障,使得原本连通的网络变成了一块一块的分区,若允许系统继续工作,那么就是分区可容忍。
由于CAP理论的存在,为了提高性能,出现了ACID的一种变种BASE(Basically Available,Soft-state,Eventually consistency)是,它是一个弱一致性理论,只要求最终一致性。
(1)Basically Available:基本可用;
(2)Soft-state:软状态,可以理解为“无连接”的,而与之相对应的Hard state就是“面向连接”的;
(3)Eventually consistency:最终一致性,最终整个系统看到的数据是一致的。
12.3.2 NOSQL数据库的种类
NOSQL数据库的种类及对应的代表性产品、数据模型、应用场景、优缺点如下表所示(图表来源网络稍加修改)。
多值数据库是分布式数据库系统的重要分支,它速度快、体积小、比关系数据库便宜;它提供一个通用的数据集成与访问平台,屏蔽现有各数据库系统不同的访问方法和用户界面,给用户呈现出一个访问多种数据库的公共接口。
多值数据库系统使用的多个异构的数据源之间可以共享它们相互依赖的数据,并具有相互操作的能力,在电子政务、电子商务、企业信息集成、军事指挥、金融证券、办公自动化、远程教育、远程医疗等领域发挥巨大的支撑作用。
常用的多值数据库有Rocket U2、Extensible storage Engin、OpenInsight、OpenQM。
说明:
1.疏忽、遗漏、错误之处,欢迎留言批评指正。
2.第12章总结完毕,后续会继续完善补充本章的历年真题,转载请注明出处,整理不易,谢谢!
最近几个月钟哥案子忙到飞起,但是这么忙的钟哥还不忘抽空发温馨提示,喜欢!