数据库方面的知识

数据库基础
1.试述数据、数据库、数据库系统、数据库管理系统的概念。
  数据:描述事物的符号记录称为数据。数据的种类有文字、图形、图象、声音、正文等等。数据与其语义是不可分的。
  *解析:在现代计算机系统中数据的概念是广义的。早期的计算机系统主要用于科学计算,处理的数据是整数、实数、浮点数等传统数学中的数据等。现在计算机能存储和处理的对象十分广泛,表示这些对象的 数据也越来越复杂。
  数据与其语义是不可分的。500这个数字可以表示一件物品的价格是500元,也可以表示一个学术会议参加的人数有500人。还可以表示一袋奶粉重500克。
  数据库:数据库是长期储存在计算机内、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
  *解析:简单地讲,数据数据库数据具有永久储存、有组织和可共享三个特点。
  数据模型是数据库的核心概念。每个数据库中数据的都是按照某一种数据模型来组织的。
  数据库系统:数据库系统(DBS)是指在计算机系统中引入数据库后的系统构成。数据库系统由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员构成。
  *解析:数据库系统和数据库是两个概念。数据库系统是一个人-机系统,数据库是数据库系统的一个组成部分。但是在日常工作中人们常常把把数据库系统简称为数据库。希望读者能够从人们讲话或文章的上下文中区分“数据库系统”和“数据库”。不要引起混淆。
  数据库管理系统:数据库管理系统(DBMS)是位于用户与操作系统之间的一层数据管理软件。用于科学地组织和存储数据、高效地获取和维护数据。DBMS主要功能包括数据定义功能、数据操纵功能、数据库的运行管理功能、数据库的建立和维护功能。
  *解析:DBMS是一个大型复杂的软件系统。是计算机中的基础软件。目前,专门研制DBMS的厂商及其研制的DBMS产品很多。著名的有美国IBM公司的DB2关系数据库管理系统、IMS层次数据库管理系统;美国ORACLE公司的ORACLE关系数据库管理系统;SYBASE公司的SYBASE关系数据库管理系统;美国微软公司的SQL SERVER关系数据库管理系统等等。
  2.使用数据库系统有什么好处?
  使用数据库系统的好处是由数据库管理系统的特点或优点决定的。
  使用数据库系统的好处很多,例如可以大大提高应用开发的效率,方便用户的使用,减轻数据库系统管理人员维护的负担等。
  使用数据库系统可以大大提高应用开发的效率。因为在数据库系统中应用程序不必考虑数据的定义、存储和数据存取的具体路径,这些工作都由DBMS来完成。用一个通俗的比喻,使用了DBMS就如有了一个好参谋好助手,许多具体的技术工作都由这个助手来完成。开发人员就可以专注于应用逻辑的设计而不必为管理数据的许许多多复杂的细节操心。
  还有,当应用逻辑改变,数据的逻辑结构需要改变时,由于数据库系统提供了数据与程序之间的独立性。数据逻辑结构的改变是DBA的责任,开发人员不必修改应用程序,或者只需要修改很少的应用程序。从而既简化了应用程序的编制,又大大减少了应用程序的维护和修改。
  使用数据库系统可以减轻数据库系统管理人员维护系统的负担。因为DBMS在数据库建立、运用和维护时对数据库进行统一的管理和控制,包括数据的完整性、安全性,多用户并发控制,故障恢复等等都由DBMS执行。
  总之,使用数据库系统的优点是很多的,既便于数据的集中管理,控制数据冗余,可以提高数据的利用率和一致性,又有利于应用程序的开发和维护。读者可以在自己今后的工作中结合具体应用,认真加以体会和总结。   
  3.试述文件系统与数据库系统的区别和联系。
  文件系统与数据库系统的区别:文件系统面向某一应用程序,共享性差、冗余度大,独立性差,纪录内有结构、整体无结构,应用程序自己控制。
  数据库系统面向现实世界,共享性高、冗余度小,具有高度的物理独立性和一定的逻辑独立性,整体结构化,用数据模型描述,由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力。
  读者可以参考《概论》书中表1.1 中的有关内容。
  文件系统与数据库系统的联系是:文件系统与数据库系统都是计算机系统中管理数据的软件。
  *解析:
  文件系统是操作系统的重要组成部分,而DBMS是独立于操作系统的软件。但是DBMS是在操作系统的基础上实现的。数据库中数据的组织和存储是通过操作系统中文件系统来实现的。
 读者进一步学习数据库管理系统实现的有关课程后可以对本题有深入的理解和全面的解答。因为DBMS的实现与操作系统中的文件系统是紧密相关的。例如,数据库实现的基础是文件,对数据库的任何操作最终要转化为对文件的操作。所以在DBMS实现中数据库物理组织的基本问题是如何利用或如何选择操作系统提供的基本的文件组织方法。这里我们就不具体展开了。
  4.举出适合用文件系统而不是数据库系统的例子;再举出适合用数据库系统的应用例子。
  ·适用于文件系统而不是数据库系统的应用例子
  数据的备份,软件或应用程序使用过程中的临时数据存储一般使用文件比较合适。早期功能比较简单、比较固定的应用系统也适合用文件系统。
  ·适用于数据库系统而非文件系统的应用例子
  目前,几乎所有企业或部门的信息系统都以数据库系统为基础,都使用数据库。如一个工厂的管理信息系统(其中会包括许多子系统,如库存管理系统、物资采购系统、作业调度系统、设备管理系统、人事管理系统等等),还比如学校的学生管理系统,人事管理系统,图书馆的图书管理系统等等都适合用数据库系统。希望同学们能举出自己了解的应用例子。
  5.试述数据库系统的特点。
  数据库系统的主要特点有:
  一、数据结构化:数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。
  *解析:注意这里“整体”两个字。在数据库系统中,数据不再针对某一个应用,而是面向全组织,具有整体的结构化。不仅数据是结构化的,而且数据的存取单位即一次可以存取数据的大小也很灵活。可以小到某一个数据项(如一个学生的姓名),大到一组记录(成千上万个学生记录)。而在文件系统中,数据的存取单位只有一个:记录。如一个学生的完整记录。
  二、数据的共享性高,冗余度低,易扩充 :数据库的数据不再面向某个应用而是面向整个系统,因此可以被多个用户、多个应用、用多种不同的语言共享使用。由于数据面向整个系统,是有结构的数据,不仅可以被多个应用共享使用,而且容易增加新的应用,这就使得数据库系统弹性大,易于扩充。
  *解析:
  数据共享可以大大减少数据冗余,节约存储空间,同时还能够避免数据之间的不相容性与不一致性。
  所谓“数据面向某个应用”是指数据结构是针对某个应用设计的,只被这个应用程序或应用系统使用。可以说数据是某个应用的“私有资源”。
  所谓“弹性大”是指系统容易扩充也容易收缩,即应用增加或减少时不必修改整个数据库的结构,或者只要做很少的修改。
  我们可以取整体数据的各种子集用于不同的应用系统,当应用需求改变或增加时,只要重新选取不同的子集或加上一部分数据便可以满足新的需求。   
  三、数据独立性高:数据独立性包括数据的物理独立性和数据的逻辑独立性。数据库管理系统的模式结构和二级映象功能保证了数据库中的数据具有很高的物理独立性和逻辑独立性。
  *解析:
  所谓“独立性”即相互不依赖。数据独立性是指数据和程序相互不依赖。即数据的逻辑结构或物理结构改变了,程序不会跟着改变。数据与程序的独立,把数据的定义从程序中分离出去,加上数据的存取又由DBMS负责,简化了应用程序的编制,大大减少了应用程序的维护和修改。  
  四、数据由DBMS统一管理和控制:数据库的共享是并发的共享,即多个用户可以同时存取数据库中的数据甚至可以同时存取数据库中同一个数据。为此,DBMS必须提供统一的数据控制功能,包括数据的安全性保护,数据的完整性检查,并发控制和数据库恢复。
  *解析:
  DBMS数据控制功能包括四个方面:
  数据的安全性保护:保护数据以防止不合法的使用造成的数据的泄密和破坏;
  数据的完整性检查:将数据控制在有效的范围内或保证数据之间满足一定的关系;
  并发控制:对多用户的并发操作加以控制和协调,保证并发操作的正确性;
  数据库恢复:当计算机系统发生硬件故障、软件故障,或者由于操作员的失误以及故意的破坏影响数据库中数据的正确性,甚至造成数据库部分或全部数据的丢失时,能将数据库从错误状态恢复到某一已知的正确状态(亦称为完整状态或一致状态)。
  下面我们可以得到“什么是数据库”的一个定义:
   数据库是长期存储在计算机内有组织的大量的共享的数据集合。它可以供各种用户共享,具有最小冗余度和较高的数据独立性。DBMS在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性、安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对系统进行恢复。
  数据库系统的出现使信息系统从以加工数据的程序为中心转向围绕共享的数据库为中心的新阶段。  
  6.数据库管理系统的主要功能有哪些?
  ①数据库定义功能;
  ②数据存取功能;
  ③数据库运行管理;
  ④数据库的建立和维护功能。
  7.试述数据模型的概念、数据模型的作用和数据模型的三个要素。
  数据模型是数据库中用来对现实世界进行抽象的工具,是数据库中用于提供信息表示和操作手段的形式构架。
  一般地讲,数据模型是严格定义的概念的集合。这些概念精确地描述系统的静态特性、动态特性和完整性约束条件。因此数据模型通常由数据结构、数据操作和完整性约束三部分组成。
  ①数据结构:是所研究的对象类型的集合,是对系统的静态特性的描述。
  ②数据操作:是指对数据库中各种对象(型)的实例(值)允许进行的操作的集合,包括操作及有关的操作规则,是对系统动态特性的描述。
  ③数据的约束条件:是完整性规则的集合,完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。
  *解析:
  数据模型是数据库系统中最重要的概念之一。同学们必须通过《概论》的学习真正掌握
  数据模型的概念和作用。
  数据模型是数据库系统的基础。任何一个DBMS都以某一个数据模型为基础,或者说支持某一个数据模型。
  数据库系统中模型有不同的层次。根据模型应用的不同目的,可以将模型分成两类或说两个层次:一是概念模型,是按用户的观点来对数据和信息建模,用于信息世界的建模,强调语义表达能力,概念简单清晰;另一是数据模型,是按计算机系统的观点对数据建模,用于机器世界,人们可以用它定义、操纵数据库中的数据。一般需要有严格的形式化定义和一组严格定义了语法和语义的语言,并有一些规定和限制,便于在机器上实现。
  8.试述概念模型的作用。
  概念模型实际上是现实世界到机器世界的一个中间层次。概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象,是数据库设计人员进行数据库设计的有力工具,也是数据库设计人员和用户之间进行交流的语言。
  9.定义并解释概念模型中以下术语:
  实体,实体型,实体集,属性,码,实体联系图(E-R图)
  实体:客观存在并可以相互区分的事物叫实体。
  实体型:具有相同属性的实体具有相同的特征和性质,用实体名及其属性名集合来抽象和刻画同类实体称为实体型。
  实体集:同型实体的集合称为实体集。
  属性:实体所具有的某一特性,一个实体可由若干个属性来刻画。
  码:唯一标识实体的属性集称为码。
  实体联系图:E-R图提供了表示实体型、属性和联系的方法:
  · 实体型:用矩形表示,矩形框内写明实体名。
  · 属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。
  ·联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1 : 1,1 : n或m : n)。
  10.试给出三个实际部门的E-R图,要求实体型之间具有一对一,一对多,多对多各种不同的联系。

关系数据库

1. 试述关系模型的三个组成部分。
  2. 试述关系数据语言的特点和分类。
  3.设有一个SPJ数据库,包括S,P,J,SPJ四个关系模式:
   S( SNO,SNAME,STATUS,CITY);
   P(PNO,PNAME,COLOR,WEIGHT);
   J(JNO,JNAME,CITY);
   SPJ(SNO,PNO,JNO,QTY);
  供应商表S由供应商代码(SNO)、供应商姓名(SNAME)、供应商状态(STATUS)、供应商所在城市(CITY)组成;零件表P由零件代码(PNO)、零件名(PNAME)、颜色(COLOR)、重量(WEIGHT)组成;工程项目表J由工程项目代码(JNO)、工程项目名(JNAME)、工程项目所在城市(CITY)组成;供应情况表SPJ由供应商代码(SNO)、零件代码(PNO)、工程项目代码(JNO)、供应数量(QTY)组成,表示某供应商供应某种零件给某工程项目的数量为QTY。
  试用关系代数完成如下查询:
  (1) 求供应工程J1零件的供应商号码SNO;
  (2) 求供应工程J1零件P1的供应商号码SNO;
  (3) 求供应工程J1零件为红色的供应商号码SNO;
  (4) 求没有使用天津供应商生产的红色零件的工程号JNO;
  (5) 求至少用了供应商S1所供应的全部零件的工程号JNO。
  4. 定义并理解下列术语,说明它们之间的联系与区别:
   (1)域,笛卡尔积,关系,元组,属性
   (2)主码,候选码,外码
   (3)关系模式,关系,关系数据库
  5. 试述关系模型的完整性规则。在参照完整性中,为什么外码属性的值有时也可以为空?什么情况下才可以为空?
  6. 试述等值连接与自然连接的区别和联系。
  7. 关系代数的基本运算有哪些?
   8. 试用关系代数的基本运算来表示其他运算。
SQL语言
1. 试述SQL语言的特点。
  答:(1)综合统一。 SQL语言集数据定义语言DDL、数据操纵语言DML、数据控制语言DCL的功能于一体。
  (2)高度非过程化。用SQL语言进行数据操作,只要提出“做什么”,而无须指明“怎么做”,因此无需了解存取路径,存取路径的选择以及SQL语句的操作过程由系统自动完成。
  (3)面向集合的操作方式。SQL语言采用集合操作方式,不仅操作对象、查找结果可以是元组的集合,而且一次插入、删除、更新操作的对象也可以是元组的集合。
  (4)以同一种语法结构提供两种使用方式。SQL语言既是自含式语言,又是嵌入式语言。作为自含式语言,它能够独立地用于联机交互的使用方式,也能够嵌入到高级语言程序中,供程序员设计程序时使用。
  (5)语言简捷,易学易用。
2. 试述SQL的定义功能
  答: SQL的数据定义功能包括定义表、定义视图和定义索引。
   SQL语言使用CREATE TABLE语句定义建立基本表,;ALTER TABLE语句修改基本表定义,DROP TABLE语句删除基本表;建立索引使用CREATE INDEX语句建立索引, DROP INDEX语句删除索引表;SQL语言使用CREATE VIEW命令建立视图,DROP VIEW语句删除视图。
9. 哪类视图是可以更新的,哪类视图是不可更新的? 各举一例说明。
  答:基本表的行列子集视图一般是可更新的。如《概论》3.5.3中的例1。
  若视图的属性来自集函数、表达式,则该视图肯定是不可以更新的。
  如《概论》3.5.3中的S_G视图。 

关系系统及其优化

    1.试述关系模型的三个组成部分。
    答:关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。
 2.试述关系数据语言的特点和分类。
  答:关系数据语言可以分为三类:
   关系代数语言 例如ISBL
   关系演算语言 (元组关系演算语言 例如APLHA,QUEL 和 域关系演算语言 例如QBE)
   具有关系代数和关系演算双重特点的语言 例如SQL
   这些关系数据语言的共同特点是,具有完备的表达能力,是非过程化的集合操作语言,功能强,能够嵌入高级语言中使用。
  3. 定义并理解下列术语,说明它们之间的联系与区别:
  (1)域,关系,元组,属性
  答: 域:域是一组具有相同数据类型的值的集合。
  关系:在域D1,D2,…,Dn上笛卡尔积D1×D2×…×Dn的子集称为关系,表示为
  R(D1,D2,…,Dn)
  元组:关系中的每个元素是关系中的元组。
  属性:关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域。由于域可
  以相同,为了加以区分,必须对每列起一个名字,称为属性(Attribute)。
  (2)主码,候选码,外部码
  答: 候选码:若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码(Candidate key)。
  主码:若一个关系有多个候选码,则选定其中一个为主码(Primary key)。
  外部码:设F是基本关系R的一个或一组属性,但不是关系R的码,如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外部码(Foreign key),简称外码。
  基本关系R称为参照关系(Referencing relation),基本关系S称为被参照关系(Referenced relation)或目标关系(Target relation)。关系R和S可以是相同的关系。
  (3)关系模式,关系,关系数据库
  关系模式:关系的描述称为关系模式(Relation Schema)。它可以形式化地表示为:
  R(U,D,dom,F)
  其中R为关系名,U为组成该关系的属性名集合,D为属性组U中属性所来自的域,dom为属性向域的映象集合,F为属性间数据的依赖关系集合。
  关系:在域D1,D2,…,Dn上笛卡尔积D1×D2×…×Dn的子集称为关系,表示为
  R(D1,D2,…,Dn)
  关系是关系模式在某一时刻的状态或内容。关系模式是静态的、稳定的,而关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。
  关系数据库:关系数据库也有型和值之分。关系数据库的型也称为关系数据库模式,是对关系数据库的描述,它包括若干域的定义以及在这些域上定义的若干关系模式。关系数据库的值是这些关系模式在某一时刻对应的关系的集合,通常就称为关系数据库。
  4.试述关系模型的完整性规则。在参照完整性中,为什么外部码属性的值也可以为空?什么情况下才可以为空?
  答: 关系模型的完整性规则是对关系的某种约束条件。关系模型中可以有三类完整性约束:实体完整性、参照完整性和用户定义的完整性。
  其中实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称作是关系的两个不变性,应该由关系系统自动支持。
  1) 实体完整性规则:若属性A是基本关系R的主属性,则属性A不能取空值。
  2) 参照完整性规则:若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必
  须为: · 或者取空值(F的每个属性值均为空值);
    · 或者等于S中某个元组的主码值。
  3) 用户定义的完整性是针对某一具体关系数据库的约束条件。它反映某一具体应用所涉及的数据必须满足的语义要求。     
  在参照完整性中,外部码属性的值可以为空,它表示该属性的值尚未确定。但前提条件是该外部码属性不是其所在关系的主属性。
  例如,在下面的“学生”表中,“专业号”是一个外部码,不是学生表的主属性,可以为空。其语义是,该学生的专业尚未确定。
  学生(学号,姓名,性别,专业号,年龄)
  专业(专业号,专业名)
  而在下面的“选修”表中的“课程号”虽然也是一个外部码属性,但它又是“选修”表的主属性,所以不能为空。因为关系模型必须满足实体完整性。
  课程(课程号,课程名,学分)
  选修(学号,课程号,成绩)
 5.等值连接与自然连接的区别是什么?
  答:连接运算中有两种最为重要也最为常用的连接,一种是等值连接(equi-join),另一种是自然连接(Natural join)。
  θ为“=”的连接运算称为等值连接。
  它是从关系R与S的笛卡尔积中选取A、B属性值相等的那些元组。即等值连接为:
   R A=B S = { tr ts| tr∈R ∧ ts∈S ∧ tr[A] = ts[B] }
    自然连接(Natural join)是一种特殊的等值连接,它要求两个关系中进行比较的分量必须是相同的属性组,并且要在结果中把重复的属性去掉。即若R和S具有相同的属性组B,则自然连接可记作:
   R S = { tr ts| tr∈R ∧ ts∈S ∧ tr[B] = ts[B] }

关系数据理论

        1.理解并给出下列术语的定义:
  函数依赖、部分函数依赖、完全函数依赖、候选码、主码、 外码、全码。
  解析:解答本题不能仅仅把《概论》上的定义写下来。关键是真正理解和运用这些概念。
  答: 函数依赖:设R (U)是一个关系模式,U是R的属性集合,X和Y是U的子集。对于R (U)的任意一个可能的关系r,如果r中不存在两个元组,它们在X上的属性值相同, 而在Y上的属性值不同, 则称"X函数确定Y"或"Y函数依赖于X",记作X→Y。
  解析:1)函数依赖是最基本的一种数据依赖,也是最重要的一种数据依赖。
  2)函数依赖是属性之间的一种联系,体现在属性值是否相等。由上面的定义可以知道,如果X→Y,则r中任意两个元组,若它们在X上的属性值相同,那么在Y上的属性值一定也相同。
  3)我们要从属性间实际存在的语义来确定他们之间的函数依赖,即函数依赖反映了(描述了)现实世界的一种语义。
  4)函数依赖不是指关系模式R的在某个时刻的关系(值)满足的约束条件,而是指R任何时刻的一切关系均要满足的约束条件。
  答: 完全函数依赖、部分函数依赖:在.理解并给出下列术语的定义:
  函数依赖、部分函数依赖、完全R(U)中,如果X→Y,并且对于X的任何一个真子集X,都有X′→Y,则称Y对X完全函数依赖;若X→Y,但Y不完全函数依赖于X,则称Y对X部分函数依赖;
  候选码、主码: 设K为R(U,F)中的属性或属性组合,若K → U则K为R的候选码。若候选码多于一个,则选定其中的一个为主码。
  答: 外码:关系模式R中属性或属性组X并非R的码,但X是另一个关系模式的码,则称X是R的外部码也称外码。
  全码:整个属性组是码,称为全码(All-key)。
  2.建立一个关于系、学生、班级、学会等诸信息的关系数据库。
  描述学生的属性有:学号、姓名、出生年月、系名、班号、宿舍区。
  描述班级的属性有:班号、专业名、系名、人数、入校年份。
  描述系的属性有:系名、系号、系办公室地点、人数。 .理解并给出下列术语的定义:
  函数依赖、部分函数依赖、完全
  描述学会的属性有:学会名、成立年份、地点、人数。
  有关语义如下:一个系有若干专业,每个专业每年只招一个班,每个班有若干学生。一个系的学生住在同一宿舍区。每个学生可参加若干学会,每个学会有若干学生。学生参加某学会有一个入会年份。
  请给出关系模式,写出每个关系模式的极小函数依赖集,指出是否存在传递函数依赖,对于函数依赖左部是多属性的情况讨论函数依赖是完全函数依赖,还是部分函数依赖。
  指出各关系的候选码、外部码,有没有全码存在?
  答:关系模式: 学生S(S#,SN,SB,DN,C#,SA)
   班级C(C#,CS,DN,CNUM,CDATE) .理解并给出下列术语的定义:
  函数依赖、部分函数依赖、完全
   系 D(D#,DN,DA,DNUM)
   学会P(PN,DATE1,PA,PNUM)
   学生--学会SP(S#,PN,DATE2)
  其中,S#—学号,SN—姓名,SB—出生年月,SA—宿舍区
   C#—班号,CS—专业名,CNUM—班级人数,CDATE—入校年份
   D#—系号,DN—系名,DA—系办公室地点,DNUM—系人数
   PN—学会名,DATE1—成立年月,PA—地点,PNUM—学会人数,DATE2—入会年份
  每个关系模式的极小函数依赖集:
   S:S#→SN,S#→SB,S#→C#,C#→DN,DN→SA
   C:C#→CS,C#→CNUM,C#→CDATE,CS→DN,(CS,CDATE)→C#
   D:D#→DN,DN→D#,D#→DA,D#→DNUM
   P:PN→DATE1,PN→PA,PN→PNUM
   SP:(S#,PN)→DATE2
  S中存在传递函数依赖: S#→DN, S#→SA, C#→SA
  C中存在传递函数依赖:C#→DN
  (S#,PN)→DATE2 和(CS,CDATE)→C# 均为SP中的函数依赖,是完全函数依赖
  关系 候选码 外部码 全码
  S S# C#,DN 无
  C C#,(CS,CDATE) DN 无
  D D#和DN 无 无
  P PN 无 无
  SP (S#,PN) S#,PN 无
  3. 试由Armostrong公理系统推导出下面三条推理规则:
  (1)合并规则:若X→Z,X→Y,则有X→YZ
  (2)伪传递规则:由X→Y,WY→Z有XW→Z
  (3)分解规则:X→Y,Z 包含于 Y,有X→Z
  证: (1)已知X→Z,由增广律知XY→YZ,又因为X→Y,可得XX→XY→YZ,最后根据传递律得X→YZ。
  (2)已知X→Y,据增广律得XW→WY,因为WY→Z,所以XW→WY→Z,通过传递律可知XW→Z。
  (3)已知Z 包含于 Y,根据自反律知Y→Z,又因为X→Y,所以由传递律可得X→Z。
  4. 下面的结论哪些是正确的,哪些是错误的?对于错误的结论请给出理由或给出一个反例说明之。
  (1)任何一个二目关系都是属于3NF的。√
  (2)任何一个二目关系都是属于BCNF的。√
  (3)任何一个二目关系都是属于4NF的。√
  (5)若R.A→R.B,R.B→R.C,则R.A→R.C √
  (6)若R.A→R.B,R.A→R.C,则R.A→R.(B, C) √
  (7)若R.B→R.A,R.C→R.A,则R.(B, C)→R.A √
  (8)若R.(B, C)→R.A,则R.B→R.A,R.C→R.A ×
  反例:关系模式 SC(S#,C#,G) (S#,C#)→G,但是S# → G,C#→G

数据库设计

  1. 试述数据库设计过程。
  *解析:希望同学能够认真阅读《概论》的内容,了解并掌握数据库设计过程。这里只概要列出数据库设计过程的六个阶段:
  1) 需求分析
  2) 概念结构设计
  3) 逻辑结构设计
  4) 数据库物理设计
  5) 数据库实施
  6) 数据库运行和维护
  这是一个完整的实际数据库及其应用系统的设计过程。不仅包括设计数据库本身,还包括数据库的实施、数据库运行和维护。
  设计一个完善的数据库应用系统往往是上述六个阶段的不断反复。
  2. 试述数据库设计过程的各个阶段上的设计描述。
  *解析:这是进一步了解数据库设计的具体内容。设计描述是指在各个阶段体现设计内容,描述设计结果的各种文档、程序。
  答:各阶段的设计要点如下:
  1) 需求分析:准确了解与分析用户需求(包括数据与处理)。
  2) 概念结构设计:通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。
  3) 逻辑结构设计:将概念结构转换为某个DBMS所支持的数据模型,并对其进行优化。
  4) 数据库物理设计:为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)。
  5) 数据库实施:设计人员运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果建立数据库,编制与调试应用程序,组织数据入库,并进行试运行。
  6) 数据库运行和维护:在数据库系统运行过程中对其进行评价、调整与修改。
  3. 试述数据库设计过程中结构设计部分形成的数据库模式。
  答: 数据库结构设计的不同阶段形成数据库的各级模式,即:
  在概念设计阶段形成独立于机器特点,独立于各个DBMS产品的概念模式,在本篇中就是E-R图;
  在逻辑设计阶段将E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式;然后在基本表的基础上再建立必要的视图(View),形成数据的外模式;
  在物理设计阶段,根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式。
  概念模式是面向用户和设计人员的,属于概念模型的层次;逻辑模式、外模式、内模式是DBMS支持的模式,属于数据模型的层次。可以在DBMS中加以描述和存储。
  4. 试述数据库设计的特点。
  答: 数据库设计既是一项涉及多学科的综合性技术又是一项庞大的工程项目。其主要特点有:
  1) 数据库建设是硬件、软件和干件(技术与管理的界面)的结合。
  2) 从软件设计的技术角度看,数据库设计应该和应用系统设计相结合,也就是说,整个设计过程中要把结构(数据)设计和行为(处理)设计密切结合起来。
  5. 需求分析阶段的设计目标是什么?调查的内容是什么?
  答: 需求分析阶段的设计目标是通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求,然后在此基础上确定新系统的功能。
  调查的内容是“数据”和“处理”,即获得用户对数据库的如下要求:
  (1)信息要求。指用户需要从数据库中获得信息的内容与性质。由信息要求可以导出数据要求,即在数据库中需要存储哪些数据。
  (2)处理要求。指用户要完成什么处理功能,对处理的响应时间有什么要求,处理方式是批处理还是联机处理。
  (3)安全性与完整性要求。  
  6. 数据字典的内容和作用是什么?
  答:数据字典是系统中各类数据描述的集合。数据字典的内容通常包括:数据项、数据结构、数据流、数据存储、处理过程五个部分
  其中数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构。数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。
  数据字典的作用:
  数据字典是关于数据库中数据的描述,在需求分析阶段建立,是下一步进行概念设计的基础,并在数据库设计过程中不断修改、充实、完善。
  (注意,数据库设计阶段形成的数据字典与后面讲到的数据字典不同,后者是DBMS关于数据库中数据的描述,当然两者是有联系的)。
  7. 什么是数据库的概念结构?试述其特点和设计策略。
  答:概念结构是信息世界的结构,即概念模型,其主要特点是:
  (1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。
  (2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。
  (3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。
  (4)易于向关系、网状、层次等各种数据模型转换。
  概念结构的设计策略通常有四种:
  · 自顶向下。即首先定义全局概念结构的框架,然后逐步细化;
  · 自底向上。即首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念
  结构;
  · 逐步扩张。首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生
  成其他概念结构,直至总体概念结构;
  · 混合策略。即将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的
  框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。
  8. 什么叫数据抽象?试举例说明。
  答: 数据抽象是对实际的人、物、事和概念进行人为处理,抽取所关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。
  如分类这种抽象是:定义某一类概念作为现实世界中一组对象的类型。这些对象具有某些共同的特性和行为。它抽象了对象值和型之间的“is member of”的语义。在E-R模型中,实体型就是这种抽象。例如在学校环境中,李英是老师,表示李英是教师类型中的一员,则教师是实体型,李英是教师实体型中的一个实体值,具有教师共同的特性和行为:在某个系某个专业教学,讲授某些课程,从事某个方向的科研。  
  9.试述数据库概念结构设计的重要性和设计步骤。
  答: 重要性:
  数据库概念设计是整个数据库设计的关键,将在需求分析阶段所得到的应用需求首先抽
  象为概念结构,以此作为各种数据模型的共同基础,从而能更好地、更准确地用某一DBMS实现这些需求。
  设计步骤:
  概念结构的设计方法有多种,其中最经常采用的策略是自底向上方法,该方法的设计步
  骤通常分为两步:第1步是抽象数据并设计局部视图,第2步是集成局部视图,得到全局的概念结构
  10.什么是E-R图?构成E-R图的基本要素是什么?
  答: E-R图为实体-联系图,提供了表示实体型、属性和联系的方法,用来描述现实世界的概念模型。
  构成E-R图的基本要素是实体型、属性和联系,其表示方法为:
  · 实体型:用矩形表示,矩形框内写明实体名;
  · 属性:用椭圆形表示,并用无向边将其与相应的实体连接起来;
  · 联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1 : 1,1 : n或m : n)。  
  11. 为什么要视图集成?视图集成的方法是什么?
  答: 在对数据库系统进行概念结构设计时一般采用自底向上的设计方法,把繁杂的大系统分解子系统。首先设计各个子系统的局部视图,然后通过视图集成的方式将各子系统有机的融合起来,综合成一个系统的总视图。这样设计清晰,由简到繁。由于数据库系统是从整体角度看待和描述数据的,因此数据不再面向某个应用而是整个系统。因此必须进行视图集成,使得数据库能被全系统的多个用户、多个应用共享使用。
  一般说来,视图集成可以有两种方式:
  · 多个分E-R图一次集成;
  · 逐步集成,用累加的方式一次集成两个分E-R图。
  无论采用哪种方式,每次集成局部E-R图时都需要分两步走:
  (1)合并。解决各分E-R图之间的冲突,将各分E-R图合并起来生成初步E-R图。
  (2)修改和重构。消除不必要的冗余,生成基本E-R图。
   12. 什么是数据库的逻辑结构设计?试述其设计步骤
  答: 数据库的逻辑结构设计就是把概念结构设计阶段设计好的基本E-R图转换为与选用的DBMS产品所支持的数据模型相符合的逻辑结构。
  设计步骤为:
  (1)将概念结构转换为一般的关系、网状、层次模型;
  (2)将转换来的关系、网状、层次模型向特定DBMS支持下的数据模型转换;
  (3)对数据模型进行优化。   
  13. 试述把E-R图转换为DBTG模型和关系模型的转换规则
  答: E-R图向DBTG模型的转换规则:
  1)每个实体型转换为记录型,实体的属性转换为记录的数据项;
  2)实体型之间1:n(n≥1)的联系转换为一个系,没有任何联系的实体型转换为奇异系;
  3)K(K≥2)个实体型之间多对多的联系,引入一个连结记录,形成K个实体型和连结记录之间的K个系。连结记录的属性由诸首记录的码及联系属性所组成;
  4)同一实体型内的1:n,n:m联系,引入连结记录,转换为两个系。
  *解析:根据我国实际,网状,层次数据库系统已很少使用,因此《概论》第三版把它们删去了,有关的主要概念放在第一章数据模型中介绍。对于DBTG模型的许多概念也介绍得很简单。本题的内容已经超出了书上的内容,同学们只要了解就可以了。但是,下面E-R图向关系模型的转换规则要求同学必须掌握,并且能够举一反三。
  答: E-R图向关系模型的转换规则:
  一个实体型转换为一个关系模式。实体的属性就是关系的属性,实体的码就是关系的码。
  对于实体间的联系则有以下不同的情况:
  (1)一个1:1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。如果转换为一个独立的关系模式,则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,每个实体的码均是该关系的候选码。如果与某一端实体对应的关系模式合并,则需要在该关系模式的属性中加入另一个关系模式的码和联系本身的属性。
  (2)一个1:n联系可以转换为一个独立的关系模式,也可以与n端对应的关系模式合并。如果转换为一个独立的关系模式,则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为n端实体的码。
  (3)一个m:n联系转换为一个关系模式。与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,各实体码的组合组成该关系的码,或码的一部分。
  (4)三个或三个以上实体间的一个多元联系可以转换为一个关系模式。与该多元联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为各实体码的组合。
  (5)具有相同码的关系模式可合并。
  *14. 你能给出由E-R图转换为IMS模型的转换规则吗?
  答: E-R图向IMS模型的转换规则:
  1)每个实体型转换为记录型,实体的属性转换为记录的数据项;
  2)实体型之间1:n(n≥1)的联系转换记录型之间的有向边;
  3)实体型之间m:n(m>1,n>1)的联系则分解成一对多联系,再根据2)转换;
  4)K(K≥2)个实体型之间多对多的联系,可先转换成多对两个实体型之间的联系,再根据3)转换。
  *解析:IMS是IBM公司的层次数据库管理系统。IMS模型是层次模型。E-R图向IMS模型转换的另一种方法是,先把E-R图转换为网状模型,再利用IMS逻辑数据库LDB的概念来表示网状模型。详细方法这里从略。

数据库恢复技术

    1.试述事务的概念及事务的四个特性。
  答: 事务是用户定义的一个数据库操作序列,这些操作要么全做要么全不做,是一个不可分割的工作单位。
  事务具有四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持续性(Durability)。这个四个特性也简称为ACID特性。
  原子性:事务是数据库的逻辑工作单位,事务中包括的诸操作要么都做,要么都不做。
  一致性:事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。
  隔离性:一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的数据对其他并发事务是隔离的,并发执行的各个事务之间不能互相干扰。
  持续性:持续性也称永久性(Permanence),指一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其执行结果有任何影响。  
  2.为什么事务非正常结束时会影响数据库数据的正确性,请列举一例说明之。
  答: 事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。如果数据库系统运行中发生故障,有些事务尚未完成就被迫中断,这些未完成事务对数据库所做的修改有一部分已写入物理数据库,这时数据库就处于一种不正确的状态,或者说是不一致的状态。
  例如某工厂的库存管理系统中,要把数量为Q的某种零件从仓库1移到仓库2存放。
  则可以定义一个事务T,T包括两个操作;Q1=Q1-Q,Q2=Q2+Q。如果T非正常终止时只做了第一个操作,则数据库就处于不一致性状态,库存量无缘无故少了Q。
   3.数据库中为什么要有恢复子系统?它的功能是什么?
  答: 因为计算机系统中硬件的故障、软件的错误、操作员的失误以及恶意的破坏是不可避免的,这些故障轻则造成运行事务非正常中断,影响数据库中数据的正确性,重则破坏数据库,使数据库中全部或部分数据丢失,因此必须要有恢复子系统。
  恢复子系统的功能是:把数据库从错误状态恢复到某一已知的正确状态(亦称为一致状态或完整状态)。
  4.数据库运行中可能产生的故障有哪几类?哪些故障影响事务的正常执行?哪些故障破坏数据库数据?
  答:数据库系统中可能发生各种各样的故障,大致可以分以下几类:
  (1)事务内部的故障;
  (2)系统故障;
  (3)介质故障;
  (4)计算机病毒。
  事务故障、系统故障和介质故障影响事务的正常执行;介质故障和计算机病毒破坏数据
  库数据。  
  5.据库恢复的基本技术有哪些?
  答:数据转储和登录日志文件是数据库恢复的基本技术。
  当系统运行过程中发生故障,利用转储的数据库后备副本和日志文件就可以将数据库恢复到故障前的某个一致性状态。
  6. 数据库转储的意义是什么? 试比较各种数据转储方法。
  答: 数据转储是数据库恢复中采用的基本技术。所谓转储即DBA定期地将数据库复制到磁带或另一个磁盘上保存起来的过程。当数据库遭到破坏后可以将后备副本重新装入,将数据库恢复到转储时的状态。
  静态转储:在系统中无运行事务时进行的转储操作。静态转储简单,但必须等待正运行的用户事务结束才能进行。同样,新的事务必须等待转储结束才能执行。显然,这会降低数据库的可用性。
  动态转储:指转储期间允许对数据库进行存取或修改。动态转储可克服静态转储的缺点,它不用等待正在运行的用户事务结束,也不会影响新事务的运行。但是,转储结束时后援副本上的数据并不能保证正确有效。因为转储期间运行的事务可能修改了某些数据,使得后援副本上的数据不是数据库的一致版本。
  为此,必须把转储期间各事务对数据库的修改活动登记下来,建立日志文件(log file)。这样,后援副本加上日志文件就能得到数据库某一时刻的正确状态。
  转储还可以分为海量转储和增量转储两种方式。
  海量转储是指每次转储全部数据库。增量转储则指每次只转储上一次转储后更新过的数据。从恢复角度看,使用海量转储得到的后备副本进行恢复一般说来更简单些。但如果数据库很大,事务处理又十分频繁,则增量转储方式更实用更有效。
  7. 什么是日志文件?为什么要设立日志文件?
  答:

        (1)日志文件是用来记录事务对数据库的更新操作的文件。
  (2)设立日志文件的目的是: 进行事务故障恢复;进行系统故障恢复;协助后备副本进行介质故障恢复。 

        8. 登记日志文件时为什么必须先写日志文件,后写数据库?
  答: 把对数据的修改写到数据库中和把表示这个修改的日志记录写到日志文件中是两个不同的操作。有可能在这两个操作之间发生故障,即这两个写操作只完成了一个。
  如果先写了数据库修改,而在运行记录中没有登记这个修改,则以后就无法恢复这个修改了。如果先写日志,但没有修改数据库,在恢复时只不过是多执行一次UNDO操作,并不会影响数据库的正确性。所以一定要先写日志文件,即首先把日志记录写到日志文件中,然后写数据库的修改。  
  9. 针对不同的故障,试给出恢复的策略和方法。(即如何进行事务故障的恢复?系统故障的恢复?介质故障恢复?)
  答: 事务故障的恢复:
  事务故障的恢复是由DBMS自动完成的,对用户是透明的。
  DBMS执行恢复步骤是:
  (1)反向扫描文件日志(即从最后向前扫描日志文件),查找该事务的更新操作。
  (2)对该事务的更新操作执行逆操作。即将日志记录中“更新前的值”写入数据库。
  (3)继续反向扫描日志文件,做同样处理。
  (4)如此处理下去,直至读到此事务的开始标记,该事务故障的恢复就完成了。
  答: 系统故障的恢复:
  系统故障可能会造成数据库处于不一致状态:
  一是未完成事务对数据库的更新可能已写入数据库;
  二是已提交事务对数据库的更新可能还留在缓冲区,没来得及写入数据库。
  因此恢复操作就是要撤销(UNDO)故障发生时未完成的事务,重做(REDO)已完成的事务。
  系统的恢复步骤是:
  (1)正向扫描日志文件,找出在故障发生前已经提交的事务队列(REDO队列)和未完成的事务队列(UNDO队列)。
  (2)对撤销队列中的各个事务进行UNDO处理。
  进行UNDO处理的方法是,反向扫描日志文件,对每个UNDO事务的更新操作执行逆操作,即将日志记录中“更新前的值”(Before Image)写入数据库。
  (3)对重做队列中的各个事务进行REDO处理。
  进行REDO处理的方法是:正向扫描日志文件,对每个REDO事务重新执行日志文件登记的操作。即将日志记录中“更新后的值”(After Image)写入数据库。
  *解析:
  在第(1)步中如何找出REDO队列和UNDO队列?请大家思考一下。
  下面给出一个算法:
  1) 建立两个事务队列:
  · UNDO-LIST: 需要执行undo操作的事务集合;
  · REDO-LIST: 需要执行redo操作的事务集合;
  两个事务队列初始均为空。
  2) 从日志文件头开始,正向扫描日志文件
  · 如有新开始(遇到Begin Transaction)的事务Ti,把Ti暂时放入UNDO-LIST队列;
  · 如有提交的事务(遇到End Transaction)Tj,把Tj从UNDO-LIST队列移到REDO-LIST队列;
  直到日志文件结束
  答: 介质故障的恢复:
  介质故障是最严重的一种故障。
  恢复方法是重装数据库,然后重做已完成的事务。具体过程是:
  (1)DBA装入最新的数据库后备副本(离故障发生时刻最近的转储副本),使数据库恢复到转储时的一致性状态。
  (2)DBA装入转储结束时刻的日志文件副本
  (3)DBA启动系统恢复命令,由DBMS完成恢复功能,即重做已完成的事务。
  *解析
  1)我们假定采用的是静态转储,因此第(1)步装入数据库后备副本便可以了。
  2)如果采用的是静动态转储,第(1)步装入数据库后备副本还不够,还需同时装入转储开始时刻的日志文件副本,经过处理后才能得到正确的数据库后备副本。
  3)第(2)步重做已完成的事务的算法是:
  a. 正向扫描日志文件,找出故障发生前已提交的事务的标识,将其记入重做队列
  b. 再一次正向扫描日志文件,对重做队列中的所有事务进行重做处理。即将日志记录中“更新后的值”写入数据库。
  10. 具有检查点的恢复技术有什么优点?
  答: 利用日志技术进行数据库恢复时,恢复子系统必须搜索日志,确定哪些事务需要REDO,哪些事务需要UNDO。一般来说,需要检查所有日志记录。这样做有两个问题:
  一是搜索整个日志将耗费大量的时间。
  二是很多需要REDO处理的事务实际上已经将它们的更新操作结果写到数据库中了,恢复子系统又重新执行了这些操作,浪费了大量时间。
  检查点技术就是为了解决这些问题。
  11. 试述使用检查点方法进行恢复的步骤。
  答: ① 从重新开始文件中找到最后一个检查点记录在日志文件中的地址,由该地址在日志文件中找到最后一个检查点记录。
  ② 由该检查点记录得到检查点建立时刻所有正在执行的事务清单ACTIVE-LIST。
  这里建立两个事务队列:
  · UNDO-LIST: 需要执行undo操作的事务集合;
  · REDO-LIST: 需要执行redo操作的事务集合;
  把ACTIVE-LIST暂时放入UNDO-LIST队列,REDO队列暂为空。
  ③ 从检查点开始正向扫描日志文件
  · 如有新开始的事务Ti,把Ti暂时放入UNDO-LIST队列;
  · 如有提交的事务Tj,把Tj从UNDO-LIST队列移到REDO-LIST队列,直到日志文件结束;
  ④ 对UNDO-LIST中的每个事务执行UNDO操作, 对REDO-LIST中的每个事务执行REDO操作。
  12. 什么是数据库镜像?它有什么用途?
  答: 数据库镜像即根据DBA的要求,自动把整个数据库或者其中的部分关键数据复制到另一个磁盘上。每当主数据库更新时,DBMS自动把更新后的数据复制过去,即DBMS自动保证镜像数据与主数据的一致性。
  数据库镜像的用途有:
  一是用于数据库恢复。当出现介质故障时,可由镜像磁盘继续提供使用,同时DBMS自动利用镜像磁盘数据进行数据库的恢复,不需要关闭系统和重装数据库副本。
  二是提高数据库的可用性。在没有出现故障时,当一个用户对某个数据加排它锁进行修改时,其他用户可以读镜像数据库上的数据,而不必等待该用户释放锁。
  *13. 试述你了解的某一个实际的DBMS产品中采用的恢复策略。
  答: 下面简单介绍一下Oracle的恢复技术:
  Oracle中恢复机制也采用了转储和登记日志文件两个技术。
  Oracle向DBA提供了多种转储后备副本的方法,如文件拷贝、利用Oracle的Export实用程序、用SQL命令Spool以及自己编程实现等。相应地,Oracle也提供了多种重装后备副本的方法,如文件拷贝、利用Oracle的Import实用程序、利用SQL*LOADER以及自己编程实现等。
  在Oracle 早期版本(V.5)中,日志文件以数据块为单位,也就是说,Oracle的恢复操作是基于数据块的,不是基于操作的。Oracle中记录数据库更新前的旧值的日志文件称为数据库前像文件(Before Image,简称BI文件),记录数据库更新后的新值的日志文件称为数据库的后像文件(After Image,简称AI文件)。BI文件是必须配置的,AI文件是可以任选的。
  Oracle7为了能够在出现故障时更有效地恢复数据,也为了解决读“脏”数据问题,提供了REDO日志文件和回滚段(Rollback Segment)。REDO日志文件中记录了被更新数据的前像和后像。回滚段记录更新数据的前像,设在数据库缓冲区中。在利用日志文件进行故障恢复时,为减少扫描日志文件的遍数,Oracle7首先扫描REDO日志文件,重做所有操作,包括未正常提交的事务的操作,然后再根据回滚段中的数据,撤销未正常提交的事务的操作。
  详细技术希望同学自己设法了解Oracle最新版本的介绍,例如通过INTERNET访问Oracle公司的网站。也可以了解其他DBMS厂商的产品情况。
  *14. 试用恢复的基本技术设计一个恢复子系统,给出这个子系统的恢复策略,包括:
   (a) 当产生某一类故障时如何恢复数据库的方法;
   (b) 日志文件的结构;
   (c) 登记日志文件的方法;
   (d) 利用日志文件恢复事务的方法;
   (e) 转储的类型;
   (f) 转储的后备副本和日志文件如何配合使用。
  *解析:这是一个大作业。可以综合复习和运用学到的知识。设计一个恢复子系统。
  例如,日志文件的结构你可以记录为单位,也可以以数据块为单位。不同的日志文件结构,登记的日志内容,日志文件恢复事务的方法也就不同了。
  对于研究生,还应该上机模拟实现你设计的恢复子系统。

数据库并发控制

        1. 在数据库中为什么要并发控制?
  答:数据库是共享资源,通常有许多个事务同时在运行。
  当多个事务并发地存取数据库时就会产生同时读取和/或修改同一数据的情况。若对并发操作不加控制就可能会存取和存储不正确的数据,破坏数据库的一致性。所以数据库管理系统必须提供并发控制机制。
  2. 并发操作可能会产生哪几类数据不一致?用什么方法能避免各种不一致的情况?
  答:并发操作带来的数据不一致性包括三类:丢失修改、不可重复读和读“脏”数据。
  (1)丢失修改(Lost Update)
  两个事务T1和T2读入同一数据并修改,T2提交的结果破坏了(覆盖了)T1提交的结果,导致T1的修改被丢失。
  (2)不可重复读(Non-Repeatable Read)
  不可重复读是指事务T1读取数据后,事务T2执行更新操作,使T1无法再现前一次读取结果。
  (3)读“脏”数据(Dirty Read)
  读“脏”数据是指事务T1修改某一数据,并将其写回磁盘,事务T2读取同一数据后,T1由于某种原因被撤销,这时T1已修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致,则T2读到的数据就为“脏”数据,即不正确的数据。
  避免不一致性的方法和技术就是并发控制。最常用的并发控制技术是封锁技术。
  也可以用其他技术,例如在分布式数据库系统中可以采用时间戳方法来进行并发控制。
  3. 什么是封锁?
  答:封锁就是事务T在对某个数据对象例如表、记录等操作之前,先向系统发出请求,对其加锁。加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其他的事务不能更新此数据对象。
  封锁是实现并发控制的一个非常重要的技术。
  4. 基本的封锁类型有几种?试述它们的含义。
  答:基本的封锁类型有两种: 排它锁(Exclusive Locks,简称X锁) 和共享锁(Share Locks,简称S锁)。
  排它锁又称为写锁。若事务T对数据对象A加上X锁,则只允许T读取和修改A,其他任何事务都不能再对A加任何类型的锁,直到T释放A上的锁。这就保证了其他事务在T释放A上的锁之前不能再读取和修改A。
  共享锁又称为读锁。若事务T对数据对象A加上S锁,则事务T可以读A但不能修改A,其他事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁。这就保证了其他事务可以读A,但在T释放A上的S锁之前不能对A做任何修改。
     5. 什么是封锁协议?不同级别的封锁协议的主要区别是什么?
  答:在运用封锁技术对数据加锁时,要约定一些规则。例如,在运用X锁和S锁对数据对象加锁时,要约定何时申请X锁或S锁、何时释放封锁等。这些约定或者规则称为封锁协议(Locking Protocol)。对封锁方式约定不同的规则,就形成了各种不同的封锁协议。不同级别的封锁协议,例如《概论》中介绍的三级封锁协议,三级协议的主要区别在于什么操作需要申请封锁,何时申请封锁以及何时释放锁(即持锁时间的长短)。
   一级封锁协议:事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。
   二级封锁协议:一级封锁协议加上事务T在读取数据R之前必须先对其加S锁,读完后即可释放S锁。
   三级封锁协议:一级封锁协议加上事务T在读取数据R之前必须先对其加S锁,直到事务结束才释放。
  6. 不同封锁协议与系统一致性级别的关系是什么?
  答: 不同的封锁协议对应不同的一致性级别。
  一级封锁协议可防止丢失修改,并保证事务T是可恢复的。在一级封锁协议中,对读数据是不加S锁的,所以它不能保证可重复读和不读“脏”数据。
   二级封锁协议除防止了丢失修改,还可进一步防止读“脏”数据。在二级封锁协议中,由于读完数据后立即释放S锁,所以它不能保证可重复读。
   在三级封锁协议中,无论是读数据还是写数据都加长锁,即都要到事务结束时才释放封锁。所以三级封锁协议除防止了丢失修改和不读“脏”数据外,还进一步防止了不可重复读。
  7. 试述活锁的产生原因和解决方法。
  答: 活锁产生的原因:当一系列封锁不能按照其先后顺序执行时,就可能导致一些事务无限期等待某个封锁,从而导致活锁。
  避免活锁的简单方法是采用先来先服务的策略。当多个事务请求封锁同一数据对象时,封锁子系统按请求封锁的先后次序对事务排队,数据对象上的锁一旦释放就批准申请队列中第一个事务获得锁。
  8. 请给出预防死锁的若干方法。
  答: 在数据库中,产生死锁的原因是两个或多个事务都已封锁了一些数据对象,然后又都请求已被其他事务封锁的数据加锁,从而出现死等待。
  防止死锁的发生其实就是要破坏产生死锁的条件。预防死锁通常有两种方法:
  (1)一次封锁法
  要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行。
  (2)顺序封锁法
  预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁。
  不过,预防死锁的策略不大适合数据库系统的特点。
  9. 请给出检测死锁发生的一种方法,当发生死锁后如何解除死锁
  答:数据库系统一般采用允许死锁发生,DBMS检测到死锁后加以解除的方法。
  DBMS中诊断死锁的方法与操作系统类似,一般使用超时法或事务等待图法。
  超时法是:如果一个事务的等待时间超过了规定的时限,就认为发生了死锁。超时法实现简单,但有可能误判死锁,事务因其他原因长时间等待超过时限时,系统会误认为发生了死锁。若时限设置得太长,又不能及时发现死锁发生。
  DBMS并发控制子系统检测到死锁后,就要设法解除。通常采用的方法是选择一个处理死锁代价最小的事务,将其撤消,释放此事务持有的所有锁,使其他事务得以继续运行下去。当然,对撤销的事务所执行的数据修改操作必须加以恢复。
  10. 什么样的并发调度是正确的调度?
  答: 可串行化(Serializable)的调度是正确的调度。
  可串行化的调度的定义:多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行地执行它们时的结果相同,我们称这种调度策略为可串行化的调度。
  11. 试述两段锁协议的概念。
  答: 两段锁协议是指所有事务必须分两个阶段对数据项加锁和解锁。
  · 在对任何数据进行读、写操作之前,首先要申请并获得对该数据的封锁;
  · 在释放一个封锁之后,事务不再申请和获得任何其他封锁。
  “两段”的含义是,事务分为两个阶段:
  第一阶段是获得封锁,也称为扩展阶段。在这阶段,事务可以申请获得任何数据项上的任何类型的锁,但是不能释放任何锁。
  第二阶段是释放封锁,也称为收缩阶段。在这阶段,事务释放已经获得的锁,但是不能再申请任何锁。
  12. 为什么要引进意向锁? 意向锁的含义是什么?
  答: 引进意向锁是为了提高封锁子系统的效率。该封锁子系统支持多种封锁粒度。
  原因是:在多粒度封锁方法中一个数据对象可能以两种方式加锁—显式封锁和隐式封锁。因此系统在对某一数据对象加锁时不仅要检查该数据对象上有无(显式和隐式)封锁与之冲突;还要检查其所有上级结点和所有下级结点,看申请的封锁是否与这些结点上的(显式和隐式)封锁冲突;显然,这样的检查方法效率很低。为此引进了意向锁。
  意向锁的含义是:对任一结点加锁时,必须先对它的上层结点加意向锁。
   例如事务T要对某个元组加X锁,则首先要对关系和数据库加IX锁。换言之,对关系和数据库加IX锁,表示它的后裔结点—某个元组拟(意向)加X锁。
  引进意向锁后,系统对某一数据对象加锁时不必逐个检查与下一级结点的封锁冲突了。例如,事务T要对关系R加X锁时,系统只要检查根结点数据库和R本身是否已加了不相容的锁(如发现已经加了IX,则与X冲突),而不再需要搜索和检查R中的每一个元组是否加了X锁或S锁。
  13. 试述常用的意向锁:IS锁,IX锁,SIX锁,给出这些锁的相容矩阵。
  答: IS锁:如果对一个数据对象加IS锁,表示它的后裔结点拟(意向)加S锁。例如,要对某个元组加S锁,则要首先对关系和数据库加IS锁
  IX锁:如果对一个数据对象加IX锁,表示它的后裔结点拟(意向)加X锁。例如,要对某个元组加X锁,则要首先对关系和数据库加IX锁。
  SIX锁:如果对一个数据对象加SIX锁,表示对它加S锁,再加IX锁,即SIX = S + IX。
  相容矩阵(略)  
  14. 理解并解释下列术语的含义:封锁,活锁,死锁,排它锁,共享锁,并发事务的调度,可串行化的调度,两段锁协议。
  答:(略,已经在上面有关习题中解答)
  *15. 试述你了解的某一个实际的DBMS产品的并发控制机制。
  答:(略)

数据库安全性

        1. 什么是数据库的安全性?
  答: 数据库的安全性是指保护数据库以防止不合法的使用所造成的数据泄露、更改或破坏。
  2. 数据库安全性和计算机系统的安全性有什么关系?
  答: 安全性问题不是数据库系统所独有的,所有计算机系统都有这个问题。只是在数据库系统中大量数据集中存放,而且为许多最终用户直接共享,从而使安全性问题更为突出。
  系统安全保护措施是否有效是数据库系统的主要指标之一。
  数据库的安全性和计算机系统的安全性,包括操作系统、网络系统的安全性是紧密联系、相互支持的,
  3.试述实现数据库安全性控制的常用方法和技术。
  答: 实现数据库安全性控制的常用方法和技术有:
  1)用户标识和鉴别:该方法由系统提供一定的方式让用户标识自己的名字或身份。每次用户要求进入系统时,由系统进行核对,通过鉴定后才提供系统的使用权。
  2)存取控制:通过用户权限定义和合法权检查确保只有合法权限的用户访问数据库,所有未被授权的人员无法存取数据。例如C2级中的自主存取控制(DAC),B1级中的强制存取控制(MAC);
  3)视图机制:为不同的用户定义视图,通过视图机制把要保密的数据对无权存取的用户隐藏起来,从而自动地对数据提供一定程度的安全保护。
  4)审计:建立审计日志,把用户对数据库的所有操作自动记录下来放入审计日志中, DBA可以利用审计跟踪的信息,重现导致数据库现有状况的一系列事件,找出非法存取数据的人、时间和内容等。
  5)数据加密:对存储和传输的数据进行加密处理,从而使得不知道解密算法的人无法获知数据的内容。
  具体内容请参见《概论》9.2。
  4.什么是数据库中的自主存取控制方法和强制存取控制方法?
  答:自主存取控制方法:定义各个用户对不同数据对象的存取权限。当用户对数据库访问时首先检查用户的存取权限。防止不合法用户对数据库的存取。
  强制存取控制方法:每一个数据对象被(强制地)标以一定的密级,每一个用户也被(强制地)授予某一个级别的许可证。系统规定只有具有某一许可证级别的用户才能存取某一个密级的数据对象。
  *解析:自主存取控制中自主的含义是:用户可以将自己拥有的存取权限“自主”地授予别人。即用户具有一定的“自主”权。
  5.SQL语言中提供了哪些数据控制(自主存取控制)的语句?请试举几例说明它们的使用方法。
  答:SQL中 的自主存取控制是通过GRANT 语句和 REVOKE 语句来实现的。如:
  GRANT SELECT, INSERT ON Student TO 王平 WITH GRANT OPTION;
  就将Student表的SELECT和INSERT权限授予了用户王平,后面的“WITH GRANT OPTION”子句表示用户王平同时也获得了“授权”的权限,即可以把得到的权限继续授予其他用户。
  REVOKE INSERT ON Student FROM 王平 CASCADE;
  就将Student表 的INSERT权限从用户王平处收回,选项 CASCADE 表示,如果用户王平将 Student 的 INSERT 权限又转授给了其他用户,那么这些权限也将从其他用户处收回。
  8.为什么强制存取控制提供了更高级别的数据库安全性?
  答:强制存取控制(MAC)是对数据本身进行密级标记,无论数据如何复制,标记与数据是一个不可分的整体,只有符合密级标记要求的用户才可以操纵数据,从而提供了更高级别的安全性。
  9.理解并解释MAC机制中主体、客体、敏感度标记的含义。
  答:主体是系统中的活动实体,既包括DBMS所管理的实际用户,也包括代表用户的各进程。
  客体是系统中的被动实体,是受主体操纵的,包括文件、基表、索引、视图等。
  对于主体和客体,DBMS为它们每个实例(值)指派一个敏感度标记(Label)。敏感度标记被分成若干级别,例如绝密(Top Secret)、机密(Secret)、可信(Confidential)、公开(Public)等。主体的敏感度标记称为许可证级别(Clearance Level),客体的敏感度标记称为密级(Classification Level)。
  10.什么是数据库的审计功能,为什么要提供审计功能?
  答:审计功能指DBMS的审计模块在用户对数据库执行操作的同时把所有操作自动记录到系统的审计日志中。
  因为任何系统的安全保护措施都不是完美无缺的,蓄意盗窃破坏数据的人总可能存在。利用数据库的审计功能,DBA可以根据审计跟踪的信息,重现导致数据库现有状况的一系列事件,找出非法存取数据的人、时间和内容等。
  11.统计数据库中存在何种特殊的安全性问题?
  答: 统计数据库允许用户查询聚集类型的信息,如合计、平均值、最大值、最小值等,不允许查询单个记录信息。但是,人们可以从合法的查询中推导出不合法的信息,即可能存在隐蔽的信息通道,这是统计数据库要研究和解决的特殊的安全性问题。
   *12. 试述你了解的某一个实际的DBMS产品的安全性措施。
  答: 不同的DBMS产品以及同一产品的不同版本的安全措施各不相同,仁者见仁,智者见智,请读者自己了解。《概论》上9.4 简单介绍了有关ORACLE数据库的安全性措施。

数据库完整性

        1.什么是数据库的完整性?
  答:数据库的完整性是指数据的正确性和相容性。
  2.数据库的完整性概念与数据库的安全性概念有什么区别和联系?
  答:数据的完整性和安全性是两个不同的概念,但是有一定的联系。
  前者是为了防止数据库中存在不符合语义的数据,防止错误信息的输入和输出,即所谓垃圾进垃圾出(Garbage In Garbage Out)所造成的无效操作和错误结果。
  后者是保护数据库防止恶意的破坏和非法的存取。
  也就是说,安全性措施的防范对象是非法用户和非法操作,完整性措施的防范对象是不合语义的数据。
  3.什么是数据库的完整性约束条件?可分为哪几类?
  答:完整性约束条件是指数据库中的数据应该满足的语义约束条件。
   一般可以分为六类:
  静态列级约束、静态元组约束、静态关系约束、动态列级约束、动态元组约束、动态关系约束。
  静态列级约束是对一个列的取值域的说明,包括以下几方面:
   1. 对数据类型的约束,包括数据的类型、长度、单位、精度等
   2. 对数据格式的约束
   3. 对取值范围或取值集合的约束。
   4. 对空值的约束
   5. 其他约束
  静态元组约束就是规定组成一个元组的各个列之间的约束关系,静态元组约束只局限在单个元组上。
  静态关系约束是在一个关系的各个元组间或者若干关系间常常存在各种联系或约束。常见的静态关系约束有:
   1. 实体完整性约束。
   2. 参照完整性约束。
   3. 函数依赖约束。
  动态列级约束是修改列定义或列值时应满足的约束条件,包括下面两方面:
   1. 修改列定义时的约束
   2. 修改列值时的约束
  动态元组约束是指修改某个元组的值时需要参照其旧值,并且新旧值之间需要满足某种约束条件。
  动态关系约束是加在关系变化前后状态上的限制条件,例如事务一致性、原子性等约束条件。
  详细内容可以参见《概论》10.1中的介绍。
  4.DBMS的完整性控制机制应具有哪些功能?
  答:DBMS的完整性控制机制应具有三个方面的功能:
   1). 定义功能,即提供定义完整性约束条件的机制。
      2 )  .检查功能,即检查用户发出的操作请求是否违背了完整性约束条件。
   3). 违约反应:如果发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性。
  5.RDBMS在实现参照完整性时需要考虑哪些方面?
  答: RDBMS在实现参照完整性时需要考虑以下几个方面:
   1) 外码是否可以接受空值
   2) 删除被参照关系的元组时的考虑,这时系统可能采取的作法有三种:
   (a)级联删除(CASCADES);
   (b)受限删除(RESTRICTED);
   (c)置空值删除(NULLIFIES)
   3) 在参照关系中插入元组时的问题,这时系统可能采取的作法有:
   (a)受限插入
   (b)递归插入
   4) 修改关系中主码的问题
  一般是不能用UPDATE语句修改关系主码的。如果需要修改主码值,只能先删除该元组,然后再把具有新主码值的元组插入到关系中。
  如果允许修改主码,首先要保证主码的唯一性和非空,否则拒绝修改。然后要区分是参照关系还是被参照关系。
  详细讨论可以参见《概论》10.2。
  7.关系系统中,当操作违反实体完整性、参照完整性和用户定义的完整性约束条件时,一般是如何分别进行处理的?
  答: 对于违反实体完整性和用户定义的完整性的操作一般都采用拒绝执行的方式进行处理。而对于违反参照完整性的操作,并不都是简单地拒绝执行,有时要根据应用语义执行一些附加的操作,以保证数据库的正确性。具体的处理可以参见上面第5题或《概论》10.2中相应部分。
  *8. 试述你了解的某一个实际的DBMS产品的完整性控制策略。
  答:不同的DBMS产品以及同一产品的不同版本的完整性控制策略各不相同,读者要去了解某一个DBMS产品的完整性控制策略。


  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值