分布式数据库系统期末复习

简答题 65
分片设计 10
2
分页式查询优化 25*2 (5 10 10)

写在最前面

这门课没学太明白,若有问题请批评指正(っ•̀ω•́)っ✎⁾⁾ ,鞠躬

一、分布式数据库系统概述

DDBS基本概念

分布式数据库系统(DDBS)是指数据存放在计算机网络的不同场地的计算机中,每个场地都具有自治处理能力并且可以完成局部应用,而且每一个场地也参与全局应用程序的执行,全局应用程序可以通过网络通信访问系统中多个场地的数据。是地理上分散而逻辑上集中的数据库系统,其定义强调分布性和逻辑整体性两点。

作用和特点

作用
分布式数据库系统是地理上(或物理上)分散而逻辑上集中的数据库系统,因此有效地适应了地理上分散的、网络环境下的、逻辑上统一的分布式系统的需求,涉及到了数据的一致性、完整性及有效性。

特点
分布性,异构性(数据异构性,数据系统异构性,平台异构性),场地自洽性(设计自治性,通信自治性,执行自治性)。
(1)分布性是指系统的各组成单元是否位于同一场地上。
(2)异构性是指系统的各组成单元是否相同。
(3)自治性是指每个场地的独立自主能力。

优缺点

优点
1适合分布式数据管理,有效提高系统性能,如:吞吐率和响应速度提高。
2系统经济性和灵活性好,可利用现有设备和系统,降低投资。
3系统可靠性和可用性强,系统资源和数据分布在物理上不同场地上,为系统所有用户共享,且允许存储副本,提高并行执行度。
4系统具有可扩展性,易于集成现有系统。

缺点
1系统设计复杂。分片设计和分配设计依赖应用需求,且影响性能等。
2系统处理和维护复杂。需分布控制。
3系统安全性和保密性较难控制。
4系统难以改变,存取结构复杂。

二、分布式数据库系统的结构

体系结构:有哪几种类型

体系结构是按组件、组件功能以及它们的交互作用定义系统的结构。有如下两种:
① 基于客户端/服务器结构的体系结构,由 全局事务管理器 统一协调和调度事务的执行,属于紧耦合模式,导致系统复杂度高,资源利用率低。
② 基于中间件的客户端/服务器结构,由 中间件 实现桥接客户端和服务器的功能,松散耦合模式。

模式结构(从数据角度分析)

四层的模式结构:全局外层、全局概念层、局部概念层和局部内层。模式与模式之间是映射关系。
1)全局外模式:不必关心数据的分片和具体的物理分配细节,分布透明性。
2)全局概念模式:包含了全局数据特性和逻辑结构,经过分片模式、分配模式映射到局部模式。
分片模式:全局数据的逻辑划分视图,定义片段以及全局关系与片段之间的映像,分片透明性。
分配模式:划分后的分片数据的的局部物理分配视图,复制透明性。
3)局部概念模式:局部场地上的局部数据逻辑结构。当全局数据模型和局部不同时,还涉及数据模型转换等处理。
4)局部内模式:局部数据的物理结构。

组件结构(从功能)

应用处理器(AP):用于完成分布数据处理的软件。1用户接口,2语义数据控制器,3全局查询处理器,4全局执行监控器(全局事务管理器)。

数据处理器(DP):负责进行数据管理的软件。1局部查询处理。2局部恢复管理器,3运行支持处理器(存储管理器),4局部事务管理器,5局部调度管理器 通信管理器(CM):负责为AP和DP在多个场地之间传送命令和数据。

三、分布式数据库设计

数据分片定义

数据分片是将全局数据进行逻辑划分和实际物理分配的过程。全局数据由分片模式定义分成各个片段数据,各个片段数据由分配模式定义存储在各场地上。定义从全局模式到片段模式的映射关系。

分片类型

1水平分片:按元组进行划分,由分片条件决定;
2垂直分片:按关系属性划分,除关键字外,同一关系的某一属性不允许出现在一个关系的多个分片中。
3混合分片:即包括水平分片也包括垂直分片。

分片作用

1减少网络传输量。
2增大事务处理的局部性。
3提高数据的可用性和查询效率。
4 使负载均衡。减少数据访问瓶颈,提高整个系统效率。

分配设计

定义
全局数据经过分片设计,得到各个划分的片段,片段到物理场地的存储映射过程称为分配设计过程。

类型
1)非复制分配:如果每个片段只存储在一个场地上,称为分割式分布,对应的分布库,称为全分割式分布库。
2)复制分配:如果每个片段在每个场地上存有副本,称为全复制分配,对应的分布库称为全复制分布库。如果每个片段只在部分场地上存有副本,称为部分复制分配,对应的分布库称为部分复制分布库。

分片原则:专业解释

哪些数据须分布存放、哪些数据不需要分布存放、哪些数据需要复制等,对系统进行全盘考虑,使系统性能最优。
1) 完备性:一个全局关系中的数据必须完全的划分为若干片段,不允许某些数据属于全局关系但不属于任何一个片段。
如果全局关系R划分的片段为R1,R2,…,Rn,则对于R中任意数据项d(d∈R),一定存在d∈Ri(1≤i≤n)。
2)可重构性:可以由片段重构全局关系,对于垂直分片可以用连接操作重构全局关系,对于水平分片,可以用并操作重构全局关系。
如果全局关系R划分的片段为R1,R2,…,Rn,则存在关系运算,使得R=R1R2…Rn。
3)不相交性:不允许一个全局关系的某些数据既属于该全局关系的某一个片段,又属于另一个片段。
如果全局关系R水平划分的片段为R1,R2,…,Rn,则任意两个不同的片段的交集为空,即RiRj=(i≤j, 1≤i≤n, 1≤j≤n)。

四、分布式查询处理与优化

查询处理的传输代价

在分布式查询中,数据传输是衡量查询时间的主要指标,不同查询处理技术差别很大。
在集中式数据库中,查询执行开销为:I/O代价+CPU代价;
在分布式查询数据库中,查询执行开销为:I/O代价+CPU代价+通信代价;

分布式查询处理过程

从全局关系到片段关系,最后再到实际操作的副本关系。

分布式查询处理目标

转换和优化
确定出一种执行代价最小的查询执行策略或寻找相对较优的操作执行步骤
优化就是寻找执行代价(费用和时间)最小的查询执行策略,使系统执行效率降到最低。优化的目标就是指局部执行代价和网络传输代价的和最小。 局部执行代价:主要指输入/输出次数(I/O代价)及CPU处理代价。 网络传输代价:主要指传输启动代价和数据传输代价。

分布式查询处理层次(和过程是同一个问题)

查询处理层次:查询分解、全局查询优化、局部查询优化
分解:规范化、分析(检查不正确的查询,得到关系演算子集)
、约简、查询重写
查询的处理过程是从全局关系到片段关系,最后再到实际操作的副本关系。

子过程涉及的基本步骤(处理层次)

查询分解,基于全局概念模式将演算查询分解为代数查询。 Step1 – 演算规范化 Step2 – 语义分析,去掉不正确的查询。 Step3 – 简化,去除冗余的部分 Step4 –将演算查询转化为优化的代数查询。

数据本地化,分布查询映射为片段查询,简化、重组为优化(good)的查询。

全局查询优化
1找接近于最优的执行策略;
2找片段查询中最佳的操作顺序,包括通信操作。
3需要实时定义代价函数。

局部查询优化,集中的系统算法.
INGRES –动态优化( dynamic optimization)
System R – 基于穷举法的静态优化(static optimization based on exhaustive search)

分解:

1规范化、2分析(检查不正确的查询,得到关系演算子集)、3约简、4查询重写

查询重写

1直接将关系演算转换为关系代数;
2重写关系代数查询以提高性能。

数据本地化

数据本地化是将介绍全局查询到片段查询的变换。即利用全局关系与其片段关系的等价关系,将分布查询中的全局关系替换为对片段关系的查询,变换后的查询称为片段查询。对应于片段查询的查询树,称为片段查询树。

五、分布式查询的存取优化

分布式查询存取优化技术(枚举、半连接)其他问题可以从这两个里面回答出来

分布式DBS的数据分布在各个场地,查询过程中,为了减少数据网络传输量,提高查询速度,需要连接查询优化,主要有两种策略:
1)使用半连接来缩减关系(或片段),以减少联接操作的操作数,以降低传输费用;
2)枚举,直接使用连接的查询优化方案。常见的直接连接算法主要有:嵌套循环连接算法,归并排序连接算法,哈希连接算法,基于索引的连接算法。
查询操作的代价评估:综合考虑局部代价和传输代价。
若侧重传输代价,局部代价可以忽略不计时,采用半联接技术较好;
侧重局部代价时,采用直接联接比采用半联接优越。

分布式查询优化内容

确定片段查询需访问的物理副本。确定片段查询表达式操作执行的最优顺序。选择执行每个操作的方法。
优化是在片段查询的基础上进行的实际物理副本查询操作的优化。

六、分布式事务管理

事务基本概念与性质

事务是由若干个为完成某一任务而逻辑相关的操作组成的操作序列,是保证数据库正确性的基本逻辑单元。由三部分组成:1开始标识begin_transaction2数据库操作3结束标识commit(提交)或abort(废弃)

性质:

1原子性(事务所包含的操作要么全做,要么全不做)
2一致性(事务执行的结果必须是使数据库从一个一致性状态变化到另一个一致性状态,而不会停留在某种不一致的中间状态上)
3隔离性(一个事务的执行既不能被其它事务所干扰,同时也不能干扰其它事务)
4耐久性(事务一旦被提交,它对数据库的更改将是永久性的)

分布式事务基本概念

任何一个应用的请求最终将转化为对数据库的存取操作序列,该操作序列可定义为一个或几个事务。分布式事务是分布式数据库应用中的事务,也称全局事务。一个分布式事务在执行过程中,被分解为若干场地上的独立执行的操作序列。

分布式事务管理目标

使事务的执行具有较高的执行效率,具有较高的可靠性和并发性。
(维护分布式事务的ACID性质,提高系统的性能,提高系统可靠性和可用性。)

2PL协议

基本思想:分布式事务提交过程分两个阶段:决定阶段,执行阶段
实现方法:分布式数据库中,全局事务由被分解为在各个场地上举行的子事务所组成,只有当各个场地的子事务都正确执行后,全局事务才可以提交,只要有一个子事务不能提交,则全局事务应该废弃,所有子事务也应废弃,因此所有子事务正确提交是分布式事务提交的前提。

计算部分(2个)三四五章

1根据应用场景(作业涉及)
分析定义与表示(代数表达式、分片表示方式)
全局查询-查询数-优化设计 查询树的结构
分配设计 如何思考的,采取什么样的方式

2关于查询代价的计算
半连接、直接连接
给一个场景明确
场景的SQL语句表达
设计出执行计划,并计算执行代价有多少

  • 6
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
1. 填空 分布式数据库系统按局部数据库管理系统的数据模型分类,可以分为 和 两类。 同构型DDBS 异构型DDBS 分布式数据库系统按全避控制系统类型分类,可以分为 、 和 三类。 全局控制集中型DDBS 全局控制分散型DDBS 全局控制可变型DDBS 分布式数据库分布式数据库系统中各站点上数据库的逻辑集合,它由 和 组成。 应用数据库 描述数据库 数据分片的三种基本方法是: 、 和 三类。 水平分片 垂直分片 混合分片 分布式数据库中的数据分布策略有: 、 、 和 四层。 集中式 分割式 复制式 混合式 分布式数据库是多层模式结构,一般划分为 、 、 和 四层。 全局外层 全局概念层 局部概念层 局部内层 一个分布式数据库管理系统一般应包括 、 、 和 四个基本功能模块。 查询处理模块 完整性处理模块 调度处理模块 可靠性处理模块 分布透明性包括 、 和 三个层次。 分片透明性 位置透明性 局部数据模型透明性 分布式数据库系统的创建方法,大致可分为 和 两种。 组合法 重构法 集中式数据库设计一般包括:需求分析,概念设计,逻辑设计和物理设计四个阶段,分 布式数据库设计除了上述四个阶段外,还需增加一些个新的阶段 ,它位于 和 之间。 分布设计 逻辑设计 物理设计 水平分片的方法可归为 和 两种。 初级分片 导出分片 DATAID-D相对于DATAID-1增加了 和 两个阶段。 分布要求分析 分布设计 DATAID-D中的分布设计分成 、 、 和 四个阶段。 分片设计 非冗余分配 冗余分配 局部模式的重新构造 分布式查询优化的准则是 。 通信费用和响应时间最短 在分布式系统中,查询代价QC= 。 I/O代价+CPU代价+通信代价 在分布式环境下,查询可分为 、 和 三种类型。 局部查询 远程查询 全局查询 分布式查询处理可以分为 、 、 和 四层。 查询分解 数据本地化 全局优化 局部优化一个分布式事务通常是由 和 组成。 主事务 子事务 事务的四个特性是: 、 、 和 。 原子性 一致性 隔离性 耐久性 控制分布式事务所执行的控制模型有: 、 和 。 主从模型 三角模型 层次模型 分布式数据库系统中,通信故障可以分为 和 两种。 报文故障 网络分割故障 事务恢复主要是依靠 来实现的。 日志 并发控制机制可以为 和 两种类型。 悲观并发控制法 乐观并发控制法 常用的基本封锁算法有: 、 、 和 。 简单的分布式封锁方法 主站点封锁法 主副本封锁法 快照方法 预防死锁的方法有 和 两种类型。 非占先权方法 占先权方法 检测分布式死锁的三种方法是 、 和 。 集中式 层次式 分布式 2. 简答题 分布式数据库系统的特点是什么 答:物理分布性:数据不是存放在一个站点上 逻辑整体性:是与分散式数据库系统的区别 站点自治性:是与多处理机的系统的区别 数据分布透明性 集中与自治相结合 存在适当的数据冗余度 事务管理的分布性 分布式数据库中数据分片的规则是什么 答:(1)完备性原则:必须把全局关系的所有数据映射到各自片段中,绝不允许有属于 全局关系的数据却不发球它的任何一个片段。 (2)可重构原则:必须保证能够由同一个全局关系的各个片段来重建该全局关系。对于 水平分片可用并操作重构全局关系,对于垂直分片可用连接操作重构全局关系。 (3)不相交原则:关系分片后的各个片断不能重叠或只包含主键重叠。 DATAID-D相对于DATAID-1增加哪两个阶段,这两个阶段的具体工作是什么 答:(1)分布要求分析阶段:收集关于分布的信息,如水平分片的划分谓词,每一应用 在各站点激活的频率等。 (2)分布设计阶段:始于全局数据库模式的规格说明和所收集的分布要求,然后产生全 局数据的分片模式和片段的位置分配模式,分配模式描述了分配在各站点上的数据情况 。 分布式事务的一般结构是什么 答:分布式事务的一般结构为: Begin Transaction原语:开始一个事务(2分) T1[] T2[] : 子事务或操作序列 : Tn[] Commit原语:事务成功完成的结束(2分) Rollback或Abort原语:事务失败的结束(1分) 5. 论述题 分布式数据库中,"数据分配"有哪些策略"数据分片"有哪些策略 数据分片的准则是什么 数据分配是指数据在计算机网络各场地上的分配策略。包括: (1)集中式:所有数据均安排在同一个场地上。 (2)分割式:所有数据只有一份,分别被安置在若干个场地。 (3)全复制式:数据在每个场地重复存储。 (4)混合式:数据库分成若干可相交的子集,每一子集安置在一个或多个场地上,但是 每一场地未必保存全部数据。 数据分片的方式有以下三种: (1)水平分片:按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子 集为关系的一个片段。
1. 九八年秋季试题 5 1.1. 概念题 5 1.1.1. 比较半连接方法和枚举法的优缺点。 5 1.1.2. 2PL协议的基本思想。 5 1.1.3. WAL协议的主要思想。 5 1.1.4. SSPARC三级模式体系结构。 5 1.1.5. 设计OID的数据结构时应考虑哪些问题。 6 1.2. 某个大学中有若干系,且每个系有若干个班级和教研室,每个教研室有若干个教员,其中教授、副教授每个人带若干名研究生。每个班有若干名学生,每个学生可选修若干门课程,每门课程可由若干学生选修。完成下列各种要求: 6 1.3. 下面是某学院的一个学生档案数据库的全局模式: 7 1.3.1. 将全局模式进行分片,写出分片定义和分片条件。 7 1.3.2. 指出各分片的类型,并画出分片树。 8 1.3.3. 假设要求查询系号为1的所有学生的姓名和成绩,写出在全局模式上的SQL查询语句,并要求转换成相应的关系代数表示,画出全局查询树,请依次进行全局优化和分片优化,画出优化后的查询树。要求给出优化变换过程。 8 1.4. 设数据项x,y存放在S1场地,u,v存放在S2场地,有分布式事务T1和T2,T1在S1场地的操作为R1(x)W1(x)R1(y)W1(y),T2在S1场地的操作为R2(x)R2(y)W2(y);T1在S2场地上的操作作为R1(u)R1(v)W1(u),T2在S2场地上的操作作为W2(u)R2(v)W2(v)。对下述2种情况,各举一种可能的局部历程(H1和H2),并说明理由。 9 1.4.1. 局部分别是可串行化,而全局是不可串行化的 9 1.4.2. 局部和全局都是可串行化的。要求按照严格的2PL协议,加上适当的加锁和解锁命令,(注意,用rl(x)表示加读锁,wl(x)表示加对x加写锁,ul(x)表示解锁) 9 1.5. 试述面向对象的数据库系统中页面服务器和对象服务器两种Client/Server体系结构的主要特点, 10 2. 九九年春季试题 10 2.1. DBMS解决了信息处理技术中的哪些挑战? 10 2.2. 在关系数据库应用设计中,为什么要对数据库模式进行规范化? 10 2.3. 简述ACID特性。 11 2.4. 长事务处理有哪些特性,如何解决? 12 2.5. 数据库系统体系结构有哪几类,每种类型的特点是什么,关键技术有哪些? 12 2.6. 决策支持类应用与OLTP应用对于数据库系统的要求有哪些不同,支持前者的关键技术有哪些,并简述之。 12 2.7. 面向对象的数据库是如何产生的,其基本原理是什么?有哪些创新特性? 13 2.8. r r 一定等于r r 吗?在什么条件下r r = r r 成立? 14 2.9. 为了设计一个健壮的分布式系统,你必须知道可能发生哪种类型的失败。 14 2.9.1. 请列出在分布式系统中可能的失败类型: 14 2.9.2. 在你列出的失败类型中,哪些也可能发生在集中式系统中? 14 2.9.3. 对于每一种失败类型,在失败发生情况下,两段提交机制如何保证事务的原子性? 14 3. 九九年秋季试题 14 3.1. 问答题 14 3.1.1. 分布式数据库系统在系统结构、模式结构、功能模块等方面有何特点? 14 3.1.2. 给出两种2PL协议,并比较它们的优点缺点? 14 3.1.3. 解释为什么对象类的多继承存在二义性,并通过例子加以说明。 15 3.1.4. 对于下述情况,哪种并行性(查询间并行性、操作间并行性、操作内并行性)有助于正加系统的吞吐量: 15 3.2. 下面是某个公司人事数据库的两个全局关系 15 3.2.1. 将全局模式进行分片,写出分片定义和分片条件。 15 3.2.2. 指出各分片的类型,并画出分片树 15 3.2.3. 进行全局优化,画出优化后的全局查询树。 16 3.2.4. 进行分片优化,画出优化后的分片查询树。 16 3.3. 对3个关系R,S和T的分布式连接,已知有如下的剖视图: 19 3.3.1. 按照SDD-1半连接优化算法,逐步求出半连接优化集和最终执行场地; 19 3.3.2. 对以上结果做相应的优化处理。 23 3.4. 用下面的关键字值的集合构造一颗B+树:(2,3,5,7,11,17,19,23,29,31)。假定树开始是空的,且关键字的值是以升序插入到B+树中去的,B+树每个节点中含的指针数为4。 24 3.5. 考虑关系r (A,B,C),r (C,D,E),r (E,F),假设不存在主关键字。设V(C, r )=900, 24 3.6. 假设一个存储块中仅能存放一个记录且在内存中最多只有三个页框。请 出在排序合并算法中每遍形成的Runs,排序属性为第一个属性:(kangaroo,17),(wallaby,21),(emu,1),(wombat,13),(platypus,3),(lion,8),(warthg,4),(zebra,11),(meerkat,6),(hornbill,2),(baboon,12)。 24 4. 二零年春季试题 24 4.1. 24 4.1.1. 分布库管理系统有哪些主要功能模块及其作用. 24 4.1.2. 半连接方法和枚举法各适用于何种查询优化情况. 25 4.1.3. 分布式事务有哪些基本性质. 25 4.1.4. 什么是2PL协议 25 4.2. 下面是某个公司的人事关系数据库的全局模式: 25 4.2.1. 将全局模式进行分片,写出分片定义和分片条件。 26 4.2.2. 指出分片的类型,并画出分片树。 26 4.3. 对题4.2所确定的分片模式,要求查询级别高于“6”的所有职员的姓名和工资,写出的在全局模式上的SQL查询语句,并要求转换成相应的关系代数表示,画出全局查询树。 26 4.3.1. 进行全局优化,画出各步优化后的全局查询树。 26 4.3.2. 进行分片优化,画出各步优化后的分片查询树。 27 4.4. 下面是一个数据库系统出现故障是,日志文件中记录的信息; 27 4.4.1. 找出发生故障时系统中的活动事务,确定出反做和重做事务集。 27 4.4.2. 用C或其他语言定义出数据库记录(D记录)和检查点记录(K记录)的数据结构。 28 4.5. 设数据项x,y存放在S1场地,u,v存放在S2场地,有分布式事务T1和T2,T1在S1场地的操作为R1(x)W1(x)R1(y)W1(y),T2在S1场地的操作为R2(x)R2(y)W2(y);T1在S2场地上的操作作为R1(u)R1(v)W1(u),T2在S2场地上的操作作为W2(u)R2(v)W2(v)。对下述2种情况,各举一种可能的局部历程(H1和H2),并说明理由 28 4.5.1. 局部分别是可串行化,而全局是不可串行化的 28 4.5.2. 局部和全局都是可串行化的。 28 4.5.3. 要求按照严格的2PL协议,加上适当的加锁和解锁命令,(注意,用rl(x)表示加读锁,wl(x)表示加对x加写锁,ul(x)表示解锁) 28 5. 二零年秋试题 29 5.1. 概念题 29 5.1.1. 解释对象数据库系统中面向对象的相关概念 29 5.1.2. 从概念上比较对象数据库模型与对象关系模型 29 5.1.3. 利用左深树、右深树、浓密树来进行查询优化的各自特点 29 5.1.4. 试解释影响并行数据库系统中并行算法性能的三个因数 30 5.1.5. 简述用爬山算法进行查询优化的基本思想 30 5.2. 下面是某个公司一个人事关系数据库的全局模式: EMP={ENO*,ENAME,POSITION,PHONE} PAY={POSITION*,SALARY} ENO为职员号,POSITION为岗位。SALARY表示岗位对应的工资,*对应的属性表示主关键字。该公司分布在两个场地上,其中,在场地1经常处理所有职员数据,而场地2只处理工资低于1000的职员数据,为了节省磁盘空间和增大处理局部性: 30 5.2.1. 将以上全局关系进行分片设计,写出分片定义和分片条件。 30 5.2.2. 指出分片的类型,并画出分片树。 30 5.2.3. 给出分配设计。 31 5.3. 对题二所确定的分片模式,要求查询岗位为“salesman”的所有职员的姓名和工资,写出的在全局模式上的SQL查询语句,并要求转换成相应的关系代数表示,画出全局查询树。假设“salesman”的工资为800元。要求给出中间转换过程。 31 5.3.1. 进行全局优化,画出优化后的全局查询树。 31 5.3.2. 进行分片优化,画出优化后的分片查询树。 31 5.4. 按如下给出的条件,求出半连接优化计划和执行场地,并作后优化处理 32 5.5. 下面是当一个数据库系统出现故障时,日志文件中的信息 36 5.5.1. 画出对应的事务并发执行图。 37 5.5.2. 找出发生故障时系统中的活动事务,确定出反做和重做事务集。 37 5.5.3. 指出需要undo的和redo的数据记录。 37 5.6. 设数据项x,y存放在S1场地,u,v存放在S2场地,有分布式事务T1和T2。T1在S1场地的操作为R1(x)W1(x)R1(y)W1(y),T2在S1场地的操作为R2(x)R2(y)W2(y);T1在S2场地上的操作作为R1(u)R1(v)W1(u),T2在S2场地上的操作作为W2(u)R2(v)W2(v)。对下述2种情况,各举一种可能的局部历程(H1和H2),如果是可串行化的,指出事务的执行次序。对第3种情况,给出符合基本2PL协议的调度。(T1 加锁命令用L1(X)表示,开锁命令U1(X)表示。对任何数据的加锁可在事务开始后立即进行)。 38 5.6.1. 局部是不可串行化的。 38 5.6.2. 局部是可串行化的,而全局是不可串行化的。 38 5.6.3. 局部是可串行化的,全局也是可串行化的。 39 5.7. 设计一种满足下列要求的索引结构。 39 5.7.1. 被索引的数据集合为有序集 39 5.7.2. 在有序集上的查询操作都是基于位置来进行的 39 5.7.3. 当往有序集中插入或删除一个元素时,与该元素相关的后续元素的位置均要发生变化 39 5.7.4. 元素的类型可为任意类型(这一个小问题的解决需要考虑语言的特征) 39 6. 二零一春季试题 39 6.1. 39 6.1.1. 讨论集中式数据库分布式数据库各自的优缺点。 39 6.1.2. 讨论在局域网和广域网两种情况下分布库设计的区别。 39 6.1.3. 解释分片透明性、复制透明性和位置透明性等三级透明性的区别。 39 6.1.4. 解释2PC协议如何在故障情况下保证事务的原子性的 40 6.1.5. 解释严格2PL协议与基本2PL协议的区别 40 6.2. 下面是某个公司一个人事关系数据库的全局模式: EMP={ENO*,ENAME,POSITION,PHONE} PAY={POSITION*,SALARY} ENO为职员号,POSITION为岗位。SALARY表示岗位对应的工资,*对应的属性表示主关键字。该公司分布在两个场地上,其中,在场地1经常处理所有职员数据,而场地2只处理工资低于1000的职员数据,为了节省磁盘空间和增大处理局部性: 41 6.2.1. 将以上全局关系进行分片设计,写出分片定义和分片条件。 41 6.2.2. 指出分片的类型,并画出分片树。 41 6.2.3. 给出分配设计。 41 6.3. 对题二所确定的分片模式,要求查询岗位为“salesman”的所有职员的姓名和工资,写出的在全局模式上的SQL查询语句,并要求转换成相应的关系代数表示,画出全局查询树。假设“salesman”的工资为1500元。要求给出中间转换过程。 41 6.3.1. 进行全局优化,画出优化后的全局查询树 42 6.3.2. 进行分片优化,画出优化后的分片查询树。 42 6.4. 下面是当一个数据库系统出现故障时,日志文件中的信息 43 6.4.1. 画出对应的事务并发执行图。 44 6.4.2. 找出发生故障时系统中的活动事务,确定出反做和重做事务集。 44 6.4.3. 指出需要undo的和redo的数据记录。 44 6.5. 设数据项x,y存放在S1场地,u,v存放在S2场地,有分布式事务T1和T2,T1在S1场地的操作为R1(x)W1(x)R1(y)W1(y),T2在S1场地的操作为R2(x)R2(y)W2(y);T1在S2场地上的操作作为R1(u)R1(v)W1(u),T2在S2场地上的操作作为W2(u)R2(v)W2(v)。对下述2种情况,各举一种可能的局部历程(H1和H2),如果是可串行化的,指出事务的执行次序。对第3种情况,给出符合基本2PL协议的调度。(T1 加锁命令用L1(X)表示,开锁命令U1(X)表示。对任何数据的加锁可在事务开始后立即进行)。 44 6.5.1. 局部是不可串行化的。 44 6.5.2. 局部是可串行化的,而全局是不可串行化的。 45 6.5.3. 局部是可串行化的,全局也是可串行化的。 45
4.1.1. 分布库管理系统有哪些主要功能模块及其作用. 24 4.1.2. 半连接方法和枚举法各适用于何种查询优化情况. 25 4.1.3. 分布式事务有哪些基本性质. 25 4.1.4. 什么是2PL协议 25 4.2. 下面是某个公司的人事关系数据库的全局模式: 25 4.2.1. 将全局模式进行分片,写出分片定义和分片条件。 26 4.2.2. 指出分片的类型,并画出分片树。 26 4.3. 对题4.2所确定的分片模式,要求查询级别高于“6”的所有职员的姓名和工资,写出的在全局模式上的SQL查询语句,并要求转换成相应的关系代数表示,画出全局查询树。 26 4.3.1. 进行全局优化,画出各步优化后的全局查询树。 26 4.3.2. 进行分片优化,画出各步优化后的分片查询树。 27 4.4. 下面是一个数据库系统出现故障是,日志文件中记录的信息; 27 4.4.1. 找出发生故障时系统中的活动事务,确定出反做和重做事务集。 27 4.4.2. 用C或其他语言定义出数据库记录(D记录)和检查点记录(K记录)的数据结构。 28 4.5. 设数据项x,y存放在S1场地,u,v存放在S2场地,有分布式事务T1和T2,T1在S1场地的操作为R1(x)W1(x)R1(y)W1(y),T2在S1场地的操作为R2(x)R2(y)W2(y);T1在S2场地上的操作作为R1(u)R1(v)W1(u),T2在S2场地上的操作作为W2(u)R2(v)W2(v)。对下述2种情况,各举一种可能的局部历程(H1和H2),并说明理由 28 4.5.1. 局部分别是可串行化,而全局是不可串行化的 28 4.5.2. 局部和全局都是可串行化的。 28

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

是Yu欸

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值