计算机数据库三级备考（仅供学习）

咖啡不提神

已于 2024-03-28 12:57:43 修改

阅读量1.2k

点赞数 17

文章标签：数据库

于 2024-03-26 15:16:48 首次发布

本文链接：https://blog.csdn.net/m0_52680439/article/details/135843508

版权

一、数据库应用系统开发方法

1.数据库的三级模式分别为外模式（子模式、用户模式）、模式（逻辑模式）、内模式（物理模式、存储模式）。外模式是用户可见的部分数据的存在形式；模式是全体数据的逻辑结构且用户不可见；内模式对应数据的物理结构和存储方式。

2.概念数据模型不依赖于具体的计算机系统和数据库管理系统，是现实世界到信息世界的第一层抽象，强调语义表达功能，是数据库设计人员与用户交流的工具，主要用于数据库设计。

3.模式/内模式保证了数据库中数据与应用程序之间的物理独立性，外模式/模式保证了数据与应用程序之间的逻辑独立性。

4.数据库字典一般由数据库管理系统本身管理和维护。

5.数据库应用系统逻辑设计阶段工作内容：数据库逻辑结构设计、数据库事务概要设计、应用程序概要设计。

6.数据库应用系统物理设计阶段工作内容：确定存储结构、存取路径的选择和调整、确定数据存放位置和确定存储分配。

7.数据库应用系统实现与部署阶段工作内容：建立数据库结构、数据加载、事务和应用程序的编码及测试、系统集成、测试与试运行、系统部署。

8.数据库应用系统的操作可行性分析是论证DBAS开发所需的各类人员资源、软件资源、硬件资源和工作环境等以及为支持DBAS开发如何去改进加强这几个方面的资源。

9.数据可应用系统的性能需求分析包括数据操作响应时间、数据访问响应时间、系统吞吐量、允许并发访问的最大用户数、每TPS代价值（用于衡量系统性价比的指标）。

10.数据库应用系统的事务规范：事务名称、事务描述、事务所访问的数据项、事务用户。可用来表示数据库应用系统的数据处理需求。

11.系统规划与定义的内容：任务陈述、确定任务目标、确定系统范围和边界、确定用户视图。

12.瀑布模型是基于严格的、明确的需求作为软件系统开发基础的软件开发模型。

13.快速模型是一种快速开发方法，其指导思想是不必把前期各活动做得很完美后才启动下阶段的活动。

14.螺旋模型将瀑布模型的系统化与快速模型的可修改性结合起来，引入风险评估活动。

15.项目规划包括的内容：

（1）确定项目的目标和范围，根据系统规划与定义工作内容，具体说明项目的最终产品以及期望时间、成本和质量目标。

（2）根据DBAS软件开发模型分解和定义整个项目包括的工作活动和任务。

（3）估算完成该项目的规模及所需各种资源。

（4）制定合理的DBAS项目计划，包括进度、成本、质量等方面的预测和控制方案。

16.数据库应用系统的生命周期由项目规划、需求分析、系统设计、实现与部署、运行与维护五个基本活动组成。

17.数据库应用系统日常维护包括：备份与恢复、完整性维护、安全性维护、存储空间管理和并发控制。

18.DBAS生命周期中，规划与分析的主要工作内容包括：系统规划与定义（任务陈述、确定任务目标、确定范围和边界、确定用户视图）、项目规划（项目团队、项目环境、项目活动、成本预算、进度计划）和可行性分析（技术可行性、经济可行性、操作可行性、开发方案选择）。

19.从功能角度，DBAS系统通常分为四个层次实现：
（1）表示层：负责所有用户交互的功能；

（2）业务逻辑层：负责根据业务逻辑需要将表示层获取的数据进行组织后传递给数据访问层或将数据访问层获取的数据进行相应的加工处理后，传送给表示层用于展示；

（3）数据访问层：负责与DBMS系统进行交互，提取或存入应用系统所需的数据；

（4）数据持久层：负责保存和管理应用系统数据。

二、需求分析

1.数据库应用系统需求建模主要有DFD、IDEF0和UML。

2.DFD方法的四种基本元素（模型对象）：数据流（核心）、处理、数据存储和外部项（数据源、数据终点）。

3.DFD特性：抽象性、概括性。DFD图采用自顶向下逐步细化的结构化分析方法。

4.在DFD中，用箭头表示数据流，用矩形框表示处理，用圆角矩形表示数据存储，用圆角框或平行四边形框表示外部项。

5.IDEF0由箭头和活动组成。

6.数据定义语句经DDL编译器编译后，各种对象的描述信息存放在数据库的数据字典中。

7.在IDEF1X建模方法中，用矩形表示独立实体集，用圆角矩形表示从属实体集。

三、数据库结构设计

1.数据模型的三要素：数据结构、数据操作、数据完整性约束。

2.若数据文件中数据记录的排列顺序与索引文件中索引项的排列顺序一致，则称该索引文件为聚集索引，否则称为非聚集索引。

3.一个数据文件上只能建立一个聚集索引，可建立多个非聚集索引。

4.第一范式说的是每个属性不可再分。

5.第二范式说的是不能存在部分函数依赖（不能由联合主键的部分就可以推出其他字段，必须整个联合主键才能推出其他字段）

6.第三范式说的是不能存在间接依赖(A（主键）→B,B→C,A→C，就是存在间接依赖)，也就是说非主键字段之间不能存在依赖

7.在IDEF1X数据建模方法中，所有实体集的联系都必须用确定联系来描述，不允许出现不确定联系，多对多联系为非确定联系，非确定联系需要分解为若干个一对多的联系。

8.在“确定型连接联系”中，如果子女实体集中的每个实例都是由它与双亲而确定，则这个联系就被称为“标定型联系”。在标定型联系中子女实体集总是从属实体集，标定型联系用一条实线或线段把他们连接起来。1（父）端是线段原点，n（子女）端是线段的终点，用一个实心圆点表示其联系的基数是n。

10.每个实体类型都有自己的标识符，若两个实体集之间发生联系，其中一个实体类型的标识符进入另一个实体类型并与该实体类型中的标识符共同组成其标识符时，这种联系则称为标定联系。

11.数据库物理设计主要包括数据库逻辑模式描述、文件组织与存取设计、数据分布设计、确定系统配置和物理模式评估。逻辑设计包括数据库逻辑结构设计、应用程序概要设计和事务概要设计。

12.非标定型联系：如果子女实体集中每一个实例都能被唯一地确认而无需了解与之联系的双亲实体集的实例。

13.反规范化是为了减少表间的连接，提高查询性能。

14.数据分布设计任务主要体现在以下几个方面：不同类型数据的物理分布、应用数据的划分与分布、派生属性数据分布、关系模式的去规范化。

15.进行DBAS系统设计时，为避免死锁可考虑的原则

（1）降低事务隔离性级别；

（2）按同一顺序访问资源；

（3）采用小事务模式，尽量缩短事务的长度，减少占有锁的时间；

（4）尽量使用记录级别的锁（行锁），少用表级别的锁。

16.子查询中不能使用ORDER BY子句。

17.不适合使用索引的情况：

（1）查询中很少使用或者参考的列；

（2）只有很少数据值的列；

（3）经常进行更新的列。

18.散列文件（直接存取文件）

（1）优点：文件随机存放，记录不需进行排序；插入、删除方便；存取速度快；不需要索引区，节省存储空间。

（2）缺点：不能进行顺序存取，只能按关键字随机存取，只限于简单询问，并且在经过多次插入、删除、更新等操作后，也可能造成文件结构不合理，需要重新组织文件。

19.堆文件

（1）优点：无需建立索引，维护代价非常低。数据量很少时，定位文件记录的时间非常短。

（2）缺点：数据访问效率低。

20.顺序文件

（1）优点：简单，支持顺序存取（速度相对较快）和随机存取

（2）缺点：文件不能动态增长，不利于文件插入和删除

21.聚集文件：将不同关系表中有关联关系的记录存储在一起。如果某些重要而频繁的用户查询经常需要进行多表连接操作，可使用聚集文件。

22.封锁：在某一时间内禁止某用户对数据对象做某些操作以避免产生数据不一致的问题。

23.散列文件组织不适合的情况

（1）基于散列域值的非精确查询（如模糊查询、范围查询）；

（2）基于非散列域进行的查询。

24.在没有建立聚集索引的表上定义主键，系统会自动在主键上建立聚集索引。

25.SQL Server中根据索引的实现方式，索引技术可分为有序索引和散列索引。

26.在事务概要设计中，用read原语来表示应用层的Select操作。

27.关系数据库中的视图提供了逻辑数据独立性。

28.系统吞吐量：系统在单位时间内可完成的数据库事务数量。

四、数据库应用系统功能设计与实施

1.数据库完整性

（1）实体完整性：用PRIMARY KEY定义；

（2）参照完整性：用FOREIGN KEY和REFERENCES定义；

（3）用户自定义完整性：包括NOT NULL、UNIQUE等。

2.在C/S结构中，业务逻辑在客户端，事务逻辑在数据库服务器。在B/S结构中，业务逻辑在应用服务器，事务逻辑在数据库服务器。

3.在编写事务时，提高事务的隔离性级别带来的好处是降低了发生数据不一致的可能性。

4.封锁的粒度越大，并发性就越小，系统的开销就越小。

5.人机界面的设计可采用原型迭代法，首先进行初步设计，再进行用户界面细节设计，最后是原型设计与改进。

6.数据库应用系统的实施工作包括创建数据库、装载数据、编写与调试应用程序、数据库试行。

7.事务概要设计包括：事务名称、事务所访问的关系表及关系属性、事务处理逻辑、事务用户（指使用、启动、调用该事务的软件模块或系统）

8.完整性约束条件的作用对象分为列、元组和关系3种级别，

（1）对列的约束：对其值类型、范围、精度、排序等的约束条件；

（2）对元组的约束：对记录中各个属性之间的联系的约束条件；

（3）对关系的约束：对若干记录间、关系集合以上以及关系之间联系的约束条件。

9.元组的每个属性对应于文件记录中的一个域。

10.加锁阶段事务可以申请获得任何数据项上的任何类型的锁，但不允许释放任何锁。

11.两段锁协议（加锁和解锁）

（1）在对任何数据进行读、写操作之前，要申请并获得对该数据的封锁；

（2）在释放一个封锁之后，事务不再申请和获得其他任何封锁。

12.一次封锁法要求每个事务必须一次将所有的数据全部加锁，否则就不能继续执行。

13.系统总体设计的主要内容包括DBAS体系结构、软硬件选型和配置设计、应用软件总体设计和业务规则初步设计。

14.DDL（数据库模式定义语言）是用于描述数据库中要存储的现实世界实体的语言，执行后的结果不能回滚。

15.三层浏览器/服务器结构的数据库应用系统由浏览器、应用服务器和数据库服务器。表示层位于客户端，由Web浏览器实现；应用层位于Web应用服务器，实现面向具体应用领域的业务规则；数据层位于数据库服务器，通过DBMS完成具体的数据存储和数据存取等数据管理功能。

16.加锁协议中两阶段加锁协议可保证事务调度可串行性。

五、UML与数据库应用系统

1.UML的类图表示

（1）类：空心三角实线连接

（2）接口：空心三角虚线连接

（3）聚合关系：空心菱形实线连接

（4）合成关系：实心菱形实线连接

（5）用例：椭圆形

2.角色是与系统进行交互的外部实体，可以是系统用户也可以是其他系统或者硬件设备。

3.用例模型描述的是外部执行者所理解的系统功能，把满足用户需求的所有功能表示出来的工具。

4.顺序图中对象间的通信用对象生命线之间的水平消息线表示，箭头说明消息的类型，如同步、异步或简单。

5.UML中，用例用椭圆形表示，位于系统边界的内部。

6.顺序图强调的是时间，通信图强调的是空间。

7.状态图中只能有一个起始状态，可以有多个结束状态。

8.UML建模概念架构中包括元元模型层、元模型层、模型层和用户模型层四个层次。

（1）元元模型层组成了最基本的元素“事物”，代表要定义的所有事物；

（2）元模型层组成了UML的基本元素，其中的每个概念都是元元模型层“事物”概念的一个实例；

（3）模型层组成了UML的模型，其中的每个概念都是元模型层中概念的一个实例；

（4）用户模型层中每个概念都是模型层的一个实例。

9.顺序图的横向矩形框代表对象，水平消息线用于表示对象间通信。

10.UML2.0提供了13种不同的图

（1）结构图（对系统静态结构建模）：类图、对象图、复合结构图、包图、组件图、部署图；

（2）行为图（对系统动态行为建模）：例图、交互图（顺序图、通信图、交互概述图、时间图）、状态图和活动图。

11.用例模型由用例、角色和系统三部分组成。

12.UML中，用于DBAS微观设计的内容可用对象图、状态机图、时间图来表达、分析和描述某个特定状况下的系统运作情况。用于宏观设计的有包图、交互概述图和复合结构图。

13.UML类图中一对多的关系用1：*表示，ER图的一对多关系用1：m表示。

14.RecordSet的常用方法

（1）AddNew：创建一条新纪录；

（2）Cancel：撤销一次执行；

（3）Close：关闭一个RecordSet；

（4）Delete：删除一条记录或一组记录；

（5）MoveNext：将记录指针移动到下一条记录；

15.协作图（通信图）用于描述对象在空间中如何交互，除了动态交互，也直接描述了对象如何链接在一起的情形。

16.状态图用于描述一个对象在其生存期间的动态行为，表现为一个对象所经历的状态序列，引擎状态转移的事件以及因状态转移而伴随的动作。

17.顺序图用于描述指定的一组对象是如何交互的，它着眼于消息队列，也就是在消息间如何发送和接收信息。

18.部署图描述的是系统运行时的结构，展示了硬件的配置及其软件如何部署到网络结构中。

19.在UML中，聚集是一种特殊形式的关联，它表示类之间的关系是整体与部分的关系。

20.顺序图的第一个消息一般在左边第一个对象的生命线顶端，其他消息按时间顺序相继插入顺序图中，后面发生的消息的线应比前面发生的消息的线画得低一些，以表示它们之间的时间关系。

21.组件图的用途是显示系统中的软件对其他软件组件的依赖关系。

22.在UML中。当要描述状态之间的转换时，可通过时间图来体现时间因子的作用。

23.用例之间的关系包括扩展、使用和组合三种。

24.活动图用于描述系统、用例和程序模块中逻辑流程的先后执行次序或并行次序的图。

25.在UML的状态机图中，状态之间的转移是由事件驱动的。

26.用例图用于描述系统与外部系统及用户之间的交互。

27.类图主要用于表达问题领域的概念模型，除了表达抽象概念的名称外，还需要表达抽象概念的属性和行为。

28.包图用来表示包与包之间的关系的类图。

六、高级数据查询

1.标量函数的返回值可以是除了timestamp类型以外的所有数据类型。

2.标量函数是返回单个数据值的函数，不适用SET语句。

3.UNION操作符合并两个或多个SELECT语句的结果集，语句必须满足：

（1）拥有相同数量的列；

（2）列必须拥有相似的数据类型；

（3）每条SELECT语句中的列的顺序必须相同；

（4）并运算的结果集的列名选用第一个查询语句的结果集列名。

4.SQL Server中的五种约束类型：主键(PRIMMARY KEY)约束、外键(FOREIGN KEY)约束、唯一(UNIQUE)约束、缺省(DEFAULT)约束和检查(CHECK)约束。

5.开窗函数公式：函数名（列）OVER（选项）。支持两种开窗函数：排名开窗函数和聚集开窗函数。聚合开窗函数只能使用PARTITION BY子句不带任何语句，ORDER BY不能与聚合函数一同使用。

6.LIKE子句的特殊字符

（1）下划线"_"：匹配任意一个字符；

（2）百分号"%"：匹配0到多个字符；

（3）方括号"[]"：用于转义，左方括号用于转义。右方括号使用最近优先匹配原则匹配最近的左方括号；

（4）尖号"^"：排除一些字符进行匹配。

7.TOP n percent表示取查询结果的前n%行数据。

8.集合操作包括并操作UNION、交操作INTERSECT和差操作EXCEPT。

9.能够出现在SELECt语句目标列中的用户自定义函数是标量函数。

10.在T-SQL中，能够实现分情况显示不同类型数据的函数是CASE。

11.SQL Server 2008中提供了4个排名函数的区别：
（1）RANK()：返回结果集的分区内每行的排名。行的排名是相关行之前的排名数加一。如果两个或多个行与一个排名关联，则每个关联行将得到相同的排名。

（2）DENSE_RANK()：返回结果集分区中行的排名，在排名中没有任何间断。行的排名等于所讨论行之前的所有排名数加一。如果有两个或多个行受同一个分区中排名的约束，则约束行将接收相同的排名。

（3）ROW_NUMBER()：返回结果集分区内行的序列号，每个分区的第一行从一开始。ORDER BY子句可确定在特定分区中为行分配唯一ROW_NUMBER的顺序。

（4）NTILE()：将有序分区中的行分发到指定数目的组中。各个组有编号，编号从一开始。对于每一个行，将返回此行所属的组的编号。

12.件查询语句产生的结果集指定一个临时命名的名字，这些命名的结果集就称为公用表表达式。其语法格式是：WITH公用表表达式标识符（列表1......列表n）AS（SELECT语句）。

13.NOT IN和NOT EXSIST的区别

（1）对于not exists查询，内表存在空值对查询结果没有影响；对于not in查询，内表存在空值将导致最终的查询结果为空。

（2）对于not exists查询，外表存在空值，存在空值的那条记录最终会输出；对于not in查询，外表存在空值，存在空值的那条记录最终将被过滤，其他数据不受影响。

七、数据库及数据库对象

1.对于复合索引，在查询使用时，最好将WHERE条件顺序作为索引列的顺序。

2.架构是形成单个命名空间的数据库实体的集合。命名空间也是一个集合，其中每个元素的名称都是唯一的。架构与用户的关系是一对多的关系，一个用户只能对应一个架构，但多个用户可以共享一个架构。架构名可以是显式的，也可以是由DBMA提供默认名。

3.索引视图只能引用同一数据库中的基表，而不能是其他标准视图。

4.每个数据库有且仅有一个主要数据文件，可以有多个次要数据文件。

5.每个数据库必须至少有一个日志文件，也可以有多个日志文件。日志文件不包括在文件组内。一个文件不可以是多个文件组的成员。

6.SQL Server 2008数据库中主要数据文件最小不能小于3MB。

7.tempdb是临时数据库，用于保存临时对象或中间结果集，并为数据的排序等操作提供一个临时工作空间。每次启动SQL Server时都会重新创建tempdb数据库，若其损坏没有必要恢复。

8.在创建数据库时，，若没有为主要数据文件提供size，则数据库引擎将使用model数据库主要数据文件的大小。若指定了次要数据文件或日志文件，但未指定文件的size，则将以1MB作为该文件的大小。为主要数据文件指定的大小用不小于model数据库的主要数据文件的大小。

9.创建分区表的步骤

（1）创建分区函数：告诉数据库管理系统以什么方式对表进行分区；

（2）创建分区方案：将分区函数生成的分区映射到文件组中；

（3）使用分区方案创建表。

10.日志文件不包括在文件组内，日志文件和数据文件是分开管理的。

11.SQL Server实例的作业信息存储在msdb数据库中。作业是在SQL Server中定义的自动执行的一系列操作的集合，作业的执行不需要任何人工干预。

12.数据库创建后可以手工扩大（或缩小）数据文件和日志文件的空间。

13.数据库所包含文件及文件存储位置信息均保存在主要数据文件中。

14.若文件组中有多个文件，则它们在所有文件被填满之前不会自动增长，而填满后这些文件会循环增长。

15.创建分区方案时指定的文件组数不得少于分区函数生成的分区数，否则就会返回错误信息。

16.主索引决定了被索引记录的位置，辅助索引可用于任何索引目的并且可以查找多个数据文件存放的位置，位图索引一般在范围查询时使用。

17.SQL Server 2008中，用户数据库的数据文件的主要拓展名为.MDF。

18.在SQL Server 2008中，通过在视图上创建唯一聚集索引的方式可使视图的结果集保存在数据库中，这种视图被称为索引或物化视图。

19.将经常一起使用的具有公共列值的多个表中的数据行存储在一起的数据库存储方法被称为聚集。

八、数据库后台编程技术

1.查询处理器中最主要的模块是查询编译器和查询执行器，负责DML语句解析和执行。

2.一张表上可以建立多个后触发器，但只能建立一个前触发器。

3.DELETED表用于存储DELETE和UPDATE语句所影响的行的副本；INSERTED表用于存储INSERT和UPDATE语句所影响的行的副本。触发器在执行时并非会同时生成INSERTED表和DELETED表。

4.不能再视图上定义AFTER型触发器。

5.（1）使用FOR或AFTER选项定义的触发器为后触发器，只有在引发触发器执行的语句中的操作都已经成功执行，并且所有的约束检查也成功完成后，才执行该触发器；

（2）使用INSTEAD OF选项定义的触发器为前触发器，指定执行触发器而不是执行引发触发器执行的SQL语句，从而替代触发的操作。

6.若未在声明游标时指定SCROLL，则NEXT是唯一支持的提取选项。

7.存储过程是存储在数据库服务器端的可以被调用执行的代码。

8.SQL Server 2008支持三种类型的触发器

（1）DML触发器：针对表或视图的INSERT、UPDATE或DELETE语句；

（2）DDL触发器：主要对应T-SQL中的CREATE、ALTER和DROP语句，以及执行类似DDL操作的某些系统存储过程；

（3）登录触发器：在遇到LOGON事件时触发，LOGON事件是在建立用户会话时引发的。

9.在调用存储过程时，只需要声明参数的类型，不能指明参数为输出参数。只有再执行时才能指明参数为输出参数。

10.当“@@FETCH_STATUS=0”时，表示的含义是FETCH语句成功；“@@FETCH_STATUS=1”时，FETCH语句失败或者行不在结果集中；“@@FETCH_STATUS=2”时，提取的行不存在。

11.内联表值函数的使用与视图非常相似，需要放在查询语句的FROM子句中，通过SELECT语句填充函数返回的表值。

12.在SQL Server 2008中，用于判断游标数据提取状态的全局变量是@@FETCH_STATUS

13.在SQL Server 2008中，DELETED表用于存储更新前数据，INSERTED表用于更新后的数据。

14.

15.SQL Server 2008中声明游标的语句为：DECLARE x cursor FOR SELECT...

16.（1）CREATE FUNCTION：定义一个新函数；

（2）ALTER FUNCTION：修改一个函数的定义；

（3）DROP FUNCTION：删除一个函数。

17.SQL Server 2008支持两类用户自定义函数：标量函数和表值函数。

九、安全管理

1.在SQL Server 2008的自主存取控制机制中，通常将用户按其操作权限分为系统管理员、数据库对象拥有者、普通用户。

2.当用户权限与其所在的角色的权限发生冲突时，以角色的权限为标准。

3.db_datawriter固定数据库角色的成员可以再所有用户表中添加、删除和更改数据，具有执行全部数据定义语言的权限。

4.数据库强制存取控制方法的规则是：

（1）仅当主体的许可级别大于或等于客体的密级时，主体才能读取相应的客体；

（2）仅当主体的许可级别小于或等于客体的密级时，主体才能写相应的客体。

5.美国国防部发布的橘皮书和紫皮书对强制存取控制进行了全面的描述和定义，给出了通用安全性分级模式，定义了四类安全类别，其中A类提供验证保护，B类提供强制保护，C类提供自主保护，D类提供最小保护。

6.SQL Server固定数据库角色及其权限如下：

（1）db_owner：具有在数据库中进行全部操作的权限，包括配置、维护数据库及删除数据库；

（2）db_accessadmin：可以添加或删除数据库用户的权限；

（3）db_securityadmin：具有管理数据库角色、角色成员以及数据库中语句和对象的权限；

（4）db_ddladmin：具有执行数据定义语言（DDL）的权限；

（5）db_backupoperator：具有备份数据库、备份日志的权限；

（6）db_datareader：具有查询数据库中所有用户数据的权限；

（7）db_datawriter：具有插入、删除和更新数据库中所有用户数据的权限；

（8）db_denydatareader：不允许具有查询数据库中所有用户数据的权限，等同于对所有的表和视图授予了DENY SELECT权限；

（9）db_denydatawriter：不允许具有INSERT、DELETE和UPDATE数据库中所有用户数据的权限；

（10）db_creator：具有创建、删除、修改和还原数据库对象的权限；

（11）bulkadmin：执行BULK INSERT语句；

（12）diskadmin：管理磁盘文件；

（13）processadmin：管理在SQL Server实例中运行的进程；

（14）serveradmin：配置服务器范围的设置；

（15）setupadmin：添加和删除链接服务器；

（16）sysadmin：在SQL Server中进行任何活动，该角色的权限跨越所有其它固定服务器角色。

7.Oracle的安全控制机制可分为数据库级的安全控制、表级、行级和列级的安全控制。数据库的安全性通过用户身份认证和授予用户相应系统权限来保证，而表级、行级、列级的安全性是通过授予或回收对象特权保证的。

8.Oracle数据库中的用户按其操作权限大小可分为DBA用户和普通用户。

9.sa是SQL Server身份验证模式的系统管理员，但不是Windows用户，无需授权就自动具有用户数据库的更改权限。

10.所有新建数据库用户都要有对应的登录名。1个数据库用户对应1个登录名，不能添加到固定的服务器中，需要对数据库用户授权后，才能具备相应的权限。

11.SQL Server 2008中，记录SQL Server实例中所有系统级信息的系统数据库是master。

12.在SQL Server 2008中，登录账户的来源共有两种。一类是由SQL Server自身负责身份验证的登录账户；另一类是登录到SQL Server的Windows网络账户，可以是组账户或用户账户。

13.在SQL Server 2008中，用户定义的角色属于数据库级别的角色。

十、数据库运行维护和运行

1.建立索引的原则：
（1）在需要经常搜索的列上创建索引；

（2）主键上创建索引；

（3）经常用于连接的列上创建索引；

（4）经常需要根据范围进行搜索的列上创建索引；

（5）经常需要排序的列上创建索引；

（6）在where查询子句中引用效率高的列上创建索引；

（7）在order by子句、group by子句中出现的列上创建索引。

2.常见能提高连接操作性能或减少连接操作的是：

（1）增加冗余列，指在多个表中增加具有相同语义的列，常用来在查询时避免连接操作；

（2）反规范化，即降低表的规范化程度，减少表间的连接，提高查询性能；

（3）在相关列上建立索引；

（4）将表组织为聚集文件。

3.将表水平分割后，查询数据需要使用UNION操作；垂直分割后，查询数据需要JOIN操作。

4.数据库重构时可能会调整数据库的内模式，由DBA完成。

5.数据库重组并不修改原设计的逻辑和物理结构，而数据库的重构则要部分的修改数据库的模式和内模式。

6.重组工作中进行碎片整理和回收提高数据库执行效率。

7. 数据库维护的主要内容：
（1）数据库的转储和恢复；

（2）数据库安全性、完整性控制；

（3）数据库性能的检测和改善；

（4）数据库的重组和重构。

8.在多属性索引中，索引属性的顺序是按照其区分度进行排序的。

9.数据库重构应该尽量避免应用程序的改动。

10.若业务空闲时数据库服务器的CPU使用率达到90%，说明服务器的CPU资源已经严重不足；若工作高峰时CPU使用率仍然很低，则说明服务器CPU资源充足。

11.数据库应用系统正式投入运行标志着开发任务的基本结束和维护工作的开始。

12.在进行范围查询时，散列索引无效。

13.数据库监控的主要内容

（1）对数据库架构体系的监控内容包括：空间基本信息、空间使用率与剩余空间大小、空间是否具有自动扩展的能力、哪些表的扩展将引起空间的扩展、以及段的占有空间与区间数等；

（2）对数据库性能的监控内容包括：数据缓存区的命中率、库缓冲、用户锁、锁与等待、回滚段、临时段使用情况、索引的使用情况、等待事件和共享池等。

14.数据库设计过程中，数据库性能的提升，有可能导致数据冗余增加。

15.运行管理与维护阶段包括日常维护、监控与分析、性能优化调整、系统进化。

16.对数据库系统的监控分为手动监控机制和自动监控机制两种。

17.数据库管理系统一般通过周期性检查事务等待图来实现死锁检测。

18.物化（索引）视图是一种保存了查询结果的数据库对象，其中的数据是预先计算并保存在对象中的，属于存储优化方法。

19.当数据库系统中存在死锁时，通常的解决方案是选择一个或几个死锁事务，回滚或撤销这些事务。

20.在数据库调优过程中，锁的粒度越大，事务并发执行程度越低，数据库系统开销越低。

十一、故障管理

1.系统故障：数据库在运行过程中，系统突然停止运转，所有正在运行的事务以非正常的方式终止，则需要系统重新启动的故障。

2.RAID5需要三块磁盘，并把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上。对于任意三块磁盘，RAID5容量等于最小的一块磁盘容量*2。

3.主-备方式（Active-Standby模式）的特点是当Active状态服务器出现故障时，通过软件诊断将Standby机器激活，保证系统在最短时间内恢复正常使用。

4.双主机方式（Active-Active方式）指两种不同业务分别在两台服务器上互为主备状态，优点是两台服务器切换速度快，数据库连接不中断，应用不受影响。

5.事务故障包括预期内的事务故障和非预期的事务故障，两种事务故障的恢复都是由系统自动完成的，对用户是透明的。

6.日志文件的具体作用

（1）事务故障恢复和系统故障恢复必须使用日志文件；

（2）在动态转储方式中必须建立日志文件；

（3）在静态转储方式中，也可以建立日志文件。

7.登记日志文件必须遵循两条原则

（1）登记的次序严格按并行事务执行的时间次序；

（2）必须先写日志文件，后写数据库。

8.差量转储是对最近一次数据库完全转储以来发生的数据变化进行转储。

9.日志文件占用空间小，但备份比完整备份频繁，因此保留时间比完整备份短。

10.差量转储和增量转储相比，速度慢，占用空间较多，但恢复速度比增量转储快。

11.系统在恢复时，如果事务在故障发生时未完成，应该UNDO；若事务在检查点之后才提交，它们对数据库所做的修改在故障发生时还可能在缓冲区中，尚未写入数据库，所以要REDO；若事务在检查点之间已经提交，所以不必执行REDO操作。

12.在建立检查点时，数据库管理系统会将当前数据缓冲区中的所有数据写入数据库中。

13.完全转储是对数据库中所有数据进行转储，此种方式占用较多的时间和空间。

14.介质故障的容错对策有软件容错和硬件容错两种方式，

（1）软件容错是使用数据库备份及事务日志文件，通过恢复技术，恢复数据库到备份结束时的状态；

（2）硬件容错是采用双物理存储设备。

15.为保持数据库中数据的一致性，需要进行的操作：

（1）对于未完成的事务可能已经写入数据库的内容，回滚所以未完成的事务写的结果；

（2）对于已完成的事务可能部分或全部留在缓冲区的结果，需要重做所有已提交的事务。

16.数据库镜像的优点

（1）增强数据保护功能；

（2）提高数据库的可用性；

（3）提高生产数据库在升级期间的可用性、

17.事务日志用于保存对数据的更新操作。

18.对于故障发生时已提交的事务（既有BEGIN Transaction，又有commit）做REDO操作。

19.对于故障发生时尚未完成的事务（只有BEGIN Transaction，而没有commit或rollback）做UNDO操作。

20.通常数据库的转储机制有三种，分别是完全转储、差量转储和增量转储。

21.在数据库恢复过程中，检查点技术大幅度减少了数据库恢复时执行的日志恢复操作数量。

22.当数据库发生系统故障时，容错对策是在重新启动数据库后，撤销（回滚或UNDO）所有未提交事务，重做所有已提交事务。

23.数据库镜像提供了3种实现方式：
（1）高可用性：两台服务器上同步事务写入，并支持自动错误恢复；

（2）高保护：两台服务器上同步事务写入，但是错误恢复是手工的；

（3）高性能：两台服务器上的写入可以不同步，因此在性能上有所提高，只允许手工的错误恢复。

24.分片透明性是最高级别的透明性，位于全局概念模式与分片模式之间。

十二、备份与恢复数据库

1.复制数据库的方法

（1）使用复制数据库向导在服务器之间复制或移动数据库；

（2）还原数据库备份，若要复制整个数据库，可以使用BACKUP和RESTORE Transact-SQL语句。

2.数据库的完整性是指数据库中数据的正确性、一致性和相容性。

3.数据库管理员的职责有

（1）数据库的转储和恢复；

（2）数据库安全性、完整性控制；

（3）数据库性能的检测和改善；

（4）数据库的重组和重构。

4.在SQL Server 2008中，对master、model、msdb实行修改之后即备份，对用户数据库实行周期性备份，对tempdb不备份。

5.数据库差异备份所备份的内容是：从最近的一次完整备份到当前时间数据库中变化的数据和日志。

6.在备份完成之后必须再对日志进行备份的是：文件备份和差异文件备份。

7.还原备份的时候若想同时还原之后的日志，必须加上norecovery才可以还原，若有多个日志备份，除最后一个日志备份外，还原其他日志也必须加上Norecovery。

8.SQL Server 2008支持三种恢复模式

（1）简单恢复模式：无日志备份。只用于测试和开发数据库，或用于主要包含只读数据的数据库。

（2）完整恢复模式：需要日志备份。数据文件丢失或损坏不会导致丢失工作。可以恢复到任意时点，支持还原单个数据页，是数据库最常用的恢复模式。

（3）大容量日志恢复模式：需要日志备份。是完整恢复模式的附加模式，允许执行高性能的大容量复制操作。通过使用最小方式记录大多数大容量操作，减少日志空间使用量。

9.执行任一更新数据库的操作后，必须备份model数据库。

10.新建数据库用户后，建议对master数据库进行备份。

11.数据库的恢复顺序

（1）还原最新完整数据库备份而不恢复数据库；

（2）若存在差异备份，则还原最新的差异备份而不恢复数据库；

（3）从最后一次还原备份后创建的第一个事务日志开始，使用NORECOVERY选项依次还原日志。

（4）还原数据库，可与还原上一次日志备份结合使用。

12.创建备份设备的T_SQL存储过程为sp_addumpdevice。

13.SQL Server支持两种备份方式

（1）永久备份设备：先建立备份设备，然后再将数据库备份到备份设备上；

（2）临时备份设备：直接将数据库备份到物理文件上。

14.修改数据库作业后，建议备份msdb数据库。

15.对master数据库只能进行完全数据库备份操作。

16.SQL Server 2008支持对数据库中的一个数据文件进行还原的操作，在还原过程中数据库自动处于脱机状态，其他的文件都不能进行读写操作。

17.备份策略的制定包括定义备份的类型和频率、备份所需硬件的特性和速度、备份的测试方法以及备份媒体的存储位置和方法。

18.事务日志备份仅用于完整恢复模式和大容量日志恢复模式，并不备份数据库本身，只备份日志记录，而且只备份从上次备份之后到当前备份时间发生变化的日志内容。但不允许对大容量操作日志备份进行时点恢复。

19.结尾日志备份在出现故障时进行，用于防止丢失数据，可以包含纯日志记录或大容量操作日志记录。

20.SQL Server 2008支持数据库、数据文件两个级别的数据恢复。

21.NOINIT表示将该次备份内容追加到指定的媒体集上。

22.在将数据库恢复到故障点的过程中，结尾日志备份是恢复计划中的最后一个相关备份。

23.清理事务日志之后，建议对用户数据库进行备份。

24.利用事务日志备份进行恢复时要求日志链是完整的。

25.数据库备份分为完全备份和差异备份。

26.日志备份是备份自前一次备份之后的日志内容。

27.第一次数据库备份要求是完整备份，日志备份不能还原数据库物理损坏情况。

28.每个事务日志备份的序列都必须执行完整备份或差异备份之后启动。

29.数据划分方式

（1）轮转划分：对于关系顺序扫描，将第i个元组存储到标号Dimod的磁盘上，保证了元组在多个磁盘上均匀分布；

（2）范围划分：按照关系中某个属性的取值范围将数据文件划分为n部分，分别存放到磁盘上；

（3）散列划分：选定一个值域为{0,1,...,n-1}的散列函数，对关系中的元组基于划分属性进行散列，如果散列函数返回i，则将其存储到第i个磁盘；

（4）多维划分：将关系R的属性分为主划分属性和辅助划分属性。

30.在数据库系统运行维护过程中，数据库管理员岗位承担了数据库的备份与恢复、数据库的安全性和完整性·控制、数据库性能的监控分析和改进等工作。

31.备份日志的语法

BACKUP LOG 数据库名 TO 备份的位置

32.事务日志备份仅可用在完整恢复模式和大容量日志恢复模式中。

33.数据库备份包括完整数据库备份和差异数据库备份两种类型。

34.备份类型包括数据库备份、文件备份以及事务日志备份。

十三、大规模数据库架构

1.并行数据库的目标是高性能和高可用性，通过多个处理节点并行执行数据库任务，提高整个数据库系统的性能和可用性。

2.数据分配方式

（1）集中式：所有数据片段都安排在同一个场地上。便于控制，但数据过于集中，负载过重，易形成瓶颈；

（2）分割式：所有数据只有一份，它被分割成若干逻辑片段，每个逻辑片段被指派在一个特定的场地上。对局部数据控制灵活，但对全局数据存取效率较低；

（3）全复制式：数据在每个场地重复存储，即每个场地上都有一个完整的数据副本。可靠性高，响应速度快，但数据冗余大，同步维护复杂；

（4）混合式：全局数据被分为若干个数据子集，每个子集都被安排在一个或多个不同的场地上，但每个场地未必保存所有数据，是一种介于分割式和全复制式之间的分配方式。灵活性较大，可依据不同情况扬长避短，取得较高效率。

3.分布式数据库最基本特征是本地自治、非集中式管理以及高可用性。

4.只有等到数据没有被其他任何事务访问时才能加排它锁。

5.分布式数据库中，传输代价=I/O代价+CPU代价+通信代价。

6.分布式数据库系统按不同层次提供的分布透明性有：分片透明性（最高层次，位于全局概念模型和分片模型之间）、位置透明性、局部数据模型透明性（位于分配模式与局部概念模式之间）。

（1）分片透明性：是最高层次，指的是用户或应用程序只对全局关系进行操作而不必考虑关系分片的情况。

（2）位置透明性：是下一层次，指用户或应用程序只需了解数据分片情况，而不必了解片段的存储场地。

（3）局部数据模型透明性：指的是用户或用户程序不必了解局部场地上使用的是哪种数据模型，但是必须了解全局数据的分片情况，还需了解各片段的副本复制情况及各片段和它们副本的场地位置分配情况。

7.分布式数据库的事务管理包括恢复控制和并发控制，恢复控制一般采用的策略是基于两阶段提交协议。

8.并行数据库系统的主要目的是提供数据库系统吞吐率和减少事务响应时间。

9.分布式数据库系统的主要目的是实现场地自治和数据全局透明共享。

10.XML数据库需要对XML文档进行解析，因为XML文档本身标记只是文档自身的描述，需要经过数据库的解析才能达到具体的用途。

11.分布式数据库查询优化的首要目标是：使查询执行时通信代价最省。

12.层次结构可分为两层，顶层是无共享结构，底层是共享内存或共享磁盘结构。无共享结构通过最小化共享资源来降低资源竞争的概率。

13.PaaS指平台即服务，把服务器平台作为一种服务提供的商业模式。

14.SaaS指软件即服务，通过网络进行程序提供的服务。基础设施即服务是指将用于支持运作的设备对外提供服务。

15.分布式数据库系统是物理上分散、逻辑上集中的数据库系统。

16.并行数据库无法实现真正意义上的并行处理，只有当数据分布合理，易于并行处理才能将并行数据库的性能最优化。

17.分布透明性包括位置独立性、数据分片独立性和数据复制独立性。

18.数据水平分片是在关系中从行（元组）的角度依据一定条件划分为不同的片段，关系中每一行必须至少属于一个片段，以便在需要时可以重构关系。

19.数据垂直分片是在关系中从列（属性）的角度依据一定条件分为不同的片段，各片段中应该包含关系的主码，以便通过连接方式恢复关系。

20.分布式数据库采用数据分片对数据进行管理，分片有以下三个原则：

（1）完整性原则：全局关系的所有数据项必须包含在某个片段中，否则将导致数据库不完整，造成某些片段数据丢失。

（2）重构性原则：所有片段必须能够还原全局关系。

（3）不相交原则（对垂直分片的主键除外）：对于一个全局关系，要保证数据不丢失，则必须要属于某个片段，即不允许不属于任何一个片段，也不允许一个全局关系的某些数据既属于该全局关系的某些片段又属于该全局关系的另一个片段。

21.在并行数据库中，一维数据划分方法主要包括轮转法、散列划分和范围划分，其中轮转法和范围划分适合于扫描整个关系的应用，散列划分适合于点查询的应用。

22.BigTable表的索引是行关键字、列关键字和时间戳，每个单元由行关键字、列关键字和时间戳共同定位。

23.BigTable数据模型的特点

（1）表中的关键字可以是任意的字符串；

（2）列族是由列关键字组成的集合，是访问控制的基本单位；

（3）时间戳记录了BigTable是每一个数据项所包含的不同版本的数据的时间标识。

24.在BigTable中，不仅可以随意地增减行的数量，在一定的约束条件下，还可以对列的数量进行扩展。

25.全局外模式是全局应用的用户视图，即终端用户看到的逻辑上并未分布的表、视图等。

26.全局概念模式用于描述全体数据的逻辑结构和特征。

27.分片模式用于描述每个数据片段以及全局关系到片段的映像，是分布式数据库系统中全局数据的逻辑划分视图。

28.分配模式用于描述各片段到物理存放场地的映像。

29.局部概念模式用于描述全局关系在场地上存储的物理片段的逻辑结构以及特征。

30.局部内模式用于描述局部概念模式涉及的数据在本场地的物理存储。

31.全局数据库管理系统是分布式数据库管理系统的核心，它为终端用户提供分布透明性，协调全局事务在各个场地的执行，为全局应用提供支持。

32.局部数据库管理系统负责创建和管理局部数据集，提供场地自治能力，执行全局应用以及全局查询的子查询。

33.聚集函数的并行化计算可以采取“先分后合”的方法。

34.散列划分策略适合点查询，对于顺序扫描关系也非常高效。

35.轮转法策略适合于扫描整个关系的应用，不适合点查询和范围查询。

36.范围划分策略适合范围查询和点查询。

37.分布式数据库查询中，导致数据传输量大的原因主要是数据间的连接和并操作。

38.XML数据库与传统数据库相比的不同和优势

（1）XML数据库能够对半结构化数据进行有效的存取和管理；

（2）提供对标签和路径的操作；

（3）当数据本身具有层次特征时，由于XML数据格式能够清晰表达数据的层次特征，因此XML数据库便于对层次化的数据进行操作。

39.公共云指的是云以即用即付的方式提供给公众。

40.私有云是指不对公众开放的企业或组织内部数据中心的资源。

41.Google的云数据库是一个分布式的结构化数据存储系统，称作BigTable。

42.三级加锁（封锁）协议可以完全保证并发事务数据的一致性。

43.在SQL Server 2008中，可在查询语句中加入FOR XML子句实现以XML格式返回查询结果。

44.并行数据服务器分为两种结构：

（1）完全共享资源结构：对每个数据项的存取都要经过公共通信线路，其所有的处理器共享内存、磁盘等资源，

（2）完全不共享资源结构：高功能计算机系统有多个较小的系统替代，每个站点都要实现全局数据目录，每个站点有独立的内存和磁盘对应该站点的服务器。

45.在分布式数据库中，采用半连接操作可以减少场地之间的数据传输量。

46.分布式数据库分片类型：

（1）水平分片：按一定的条件把全局关系的所有元组划分成若干不相交的子集，每个子集都是关系的一个片段。

（2）垂直分片：把一个全局关系的属性集分成若干子集，并在这些子集上作投影运算，每个投影称为垂直分片。

（3）导出分片：又称为导出水平分片，即水平分片的条件不是本关系属性的条件，而是其他关系属性的条件。

（4）混合分片：上述三种方式的混合。

47.分布式数据库系统的恢复控制采用的最典型策略是基于两阶段的提交协议。

48.分布式数据库系统由局部数据库管理系统、全局数据库管理系统、全局数据字典、通信管理四部分组成。

49.并行数据库有多种体系结构，主要可分为共享内存结构、共享磁盘结构、无共享结构和层次结构。

（1）共享内存结构：所有处理机通过互联网共享一个公共的主储存器。

（2）无共享结构：每个处理机拥有独立的主存储器和磁盘，是支持并行数据库系统的最好并行结构。

50.云计算通过集中所有的计算资源，采用硬件虚拟化技术，为使用者提供强大的计算能力、存储和带宽等资源。

十四、数据仓库与数据挖掘

1.ODS具备数据仓库的部分特征和OLTP系统的部分特征，它是“面向主题的、集成的、当前或接近当前的、不断变化的”数据。

（1）第一类ODS：数据更新频率时秒级的；

（2）第二类ODS：数据更新频率是小时级的；

（3）第三类ODS：数据更新频率是天级的；

（4）第四类ODS：根据数据来源方向和类型划分的。

2.粒度是系统中存在不同综合级别的数据，一般将综合级别称为粒度。粒度越大表示综合程度越高。

3.建立数据仓库的主要目的：根据决策需求对企业的数据采取适当的手段进行集成，形成一个综合的、面向分析的数据环境，用于支持企业的信息型、决策型的分析应用。

4.OLAP（联系分析处理）仍使用DBMS存取数据。

5.元数据被定义为描述数据及其环境的数据，是关于数据的数据，描述了数据的结构、内容、链和索引等项内容。

6.元数据用于描述数据仓库内数据的结构和建立方法，可按其用途的不同分为技术元数据和业务元数据。

7.元数据的两个主要用途：首先能够提供基于用户的信息，其次能支持系统对数据的管理和维护。

8.操作型数据与分析型数据的区别

操作型数据	分析型数据
表示业务处理的动态情况	表示业务处理的静态情况
在存取的瞬间是正确的	代表过去的数据
可更新，可由录入人员更新	不可更新，终端用户的访问权限常常是只读的
处理细节问题	更多关注的是结论性的数据，是综合的，或是提炼的
操作需求事先可知，系统可按预计的工作量进行优化	操作需求事先不知道，永远不知道下一步用户要做什么
有许多事务，每个事务影响数据的一小部分	有数目不多的一些查询，每个查询可访问大量数据
面向应用，支持日常操作	面向分析，支持管理需求
用户不必理解数据库，只是输入数据库	用户需要理解数据库，以便从数据中得出有意义的结论