持续更新,共十套题。相关资料已经按知识点总结为PDF,可以通过文末下载学习。
数据库分析与设计
- 事务规范包括了事务名称、事务描述、事务所访问的数据项、事务用户。
UML与数据库应用系统
-
系统结构图
-
类图 描述系统静态结构
-
顺序图(强调的是时间),通信图 (强调的是空间) 表示系统动态结构
-
状态图只能有一个起始状态,可以有多个终止状态
第一套
选择题
- 关系模式的设计、规范化处理属于数据库逻辑结构设计的内容
- 数据持久层负责保存和管理应用数据系统数据,而数据的完整性维护属于数据持久层功能中的数据管理的内容。
- 多个小事务合并成大事务,会增加占有锁的时间,可能会造成大量阻塞事务,甚至会产生死锁。
- 数据库应用系统的实施工作包括创建数据库、装载数据、编写与调试应用程序、数据库试运行。
数据库性能调优 、数据库性能调优 、系统监控三项属于数据库运行维护与优化的工作。 - 关键字unique表示唯一索引,clustered表示聚集索引
- 数据处理需求分析结果也可以表示为事务规范。事务规范包括事务名称、事务描述、事务所访问的数据项、事务用户
- 数据库应用系统日常维护包括:备份与恢复、完整性维护、安全性维护、存储空间管理和并发控制。
模式调整属于数据库应用系统的性能优化调整的范围。
一个处理至少有一个输入流一个输出流- 对关系模式进行去规范化处理,这属于数据库结构设计中的物理结构设计 。
13. 从功能角度数据库应用系统可以划分为四个层次来实现:
①表示层:用于显示数据和接收用户输入的数据。(一般为Windows应用程序或Web应用程序)。
②业务逻辑层:是表示层和数据访问层之间的桥梁,主要负责数据的传递和处理。
③数据访问层:负责与DBMS系统进行交互,提取或存入应用系统所需的数据。
④数据持久层:负责保存和管理应用系统数据。(根据事务–基本表交叉引用矩阵来调整数据文件的组织结构) - 索引使用的原则:
1、经常在查询中作为条件被使用的列;(where)
2、频繁进行排序或分组(即进行group by或order by操作)的列;
3、一个列的值域很大;@如果待排序的列有多个,应在这些列上建立复合索引。
主索引是在主属性上建立的索引
辅索引是在非主属性上建立的索引 - IDEF1X侧重分析、抽象和概括应用领域中的数据需求,被称为数据建模方法。在IDEF1X中一个非确定联系又称为多对多关系或m:n 联系。
- 系统规划与定义的内容包括:任务陈述、确定任务目标、确定系统范围和边界、确定用户视图。
- 数据库应用系统实现与部署内容包括:①建立数据库结构;②数据加载;③事务和应用程序的编码及测试;④系统集成、测试与试运行;⑤系统部署。
ER图向关系模式转换涉及到两方面:①实体的转换;②实体间联系的转换。
实体的转换:在从ER图转换为关系模式时,一个实体就转换一个关系模式,实体的属性就是关系模式的属性,实体的键就是关系的主键。
实体间联系的转换:实体间存在三种联系,即1:1(一对一),1:n(-对多),m:n(多对多)。
在从ER向关系模式转换规则如下:
①1:1(一对一)联系
方法一:联系转换为独立的关系模式;模式的属性由联系本身的属性及两个实体的键构成;主键由两个实体中的任意一个键成。
方法二:联系与一端的实体的关系模式合并,即将联系的属性加入到实体的关系模式内,主键不变。
②1:n(一对多)联系
方法一:联系转换为独立的关系模式;模式的属性由联系本身的属性及两个实体的键构成;主键由n端实体的键组成。
方法二:与n端的实体的关系模式合并,即将联系的属性加入到实体的关系模式内,主键不变。
③m:n(多对多)联系转换成新的独立的模式,模式的属性由联系本身的属性及两个实体的键构成,主键由两端实体的键组合成。
参考链接:https://blog.csdn.net/baidu_41774120/article/details/114449377?utm_medium=distribute.pc_relevant.none-task-blog-2defaultbaidujs_title~default-0.control&spm=1001.2101.3001.4242
由题目可知,该题中有4个实体,两个二元一对多联系,两个二元多对多联系,一个三元多对多联系,两个一元多对多联系。4个实体和5个m:n(多对多)联系可以转换为单独的模式,1:n(一对多)联系需要合并到实体中去。因此可以最终得到9个模式。故答案为A。
19. 为了减少数据冗余而将一个2NF的关系模式分解为若干个3NF的关系模式,这项工作属于数据库结构设计中的 逻辑结构设计
20. 事务概要设计内容包括:事务名称、事务所访问的关系表及关系属性、事务处理逻辑、事务用户(指使用、启动、调用该事务的软件模块或系统)。
- 在IDEF1X中,如果实体集的一个实例的唯一标识依赖于该实体集与其他实体集的联系,那么它就是从属标识符实体集或简称为从属实体集。
IDEF1X用矩形框来表示独立实体集,用加了圆角的矩形框来表示从属实体集。
独立实体集与从属实体集语法如图所示:
关于IDEF1X的参考链接:计算机三级数据库----IDEF1X___联系
概念讲解有些抽象,又查阅了一些资料得到如下:
标定联系:**(主键依赖别的表)子实体主关键字是父实体主关键字的一部分;非标定联系:(主键不依赖,外键依赖)**父实体主关键字作为子实体的外键,如图2所示为标定关系与非标定关系,区别在于连接线是否为虚线。
参考链接:IDEF1X建模工具IDEF1X建模工具
非确定型联系是多对多关系
22.
为改善对这类大数据量基本表的访问性能,可将基本表划分为若干分区,各分区数据分别存储在不同位置的磁盘上,并可采用不同的物理组织方式。分区表是从物理上将一个大表分成几个小表,但从逻辑上来看还是一个大表.
分区表是从物理上将一个表划分为若干个小的子表,数据库管理系统会自动将数据放到对应的子表中
填空题
- IDEF0需求建模方法由箭头和方框两种元素构成。矩形框代表功能活动,写在方框内的动词短语描述功能活动的名称。
- 防火墙技术是用来保证数据库应用系统的网络环境安全的。
- 在UML的状态机图中,状态之间的转移是由事件驱动的。
- SELECT基本语法格式是:
SELECT 查询内容
FROM 表名
WHERE 条件表达式
GROUP BY 待分组的列名
HAVING 列名
ORDER BY 待排序的列名
可以看到后三个 按照24个英文字母表顺序
所以,Group by子句用于Order by子句之前
27. SELECT INTO语句表示从一个表中选取数据,然后把该数据插入到另一个表中。该语句结构通常用于创建表的备份复件或者用于对记录进行存档。该语句使用时要求目标表不存在,因为在插入时会自动创建。
28. 如果表已经存在,使用INSERT INTO复制表内容
29.
查询Student表中是否存在SC表中一条特定的记录,在SQL语句中被称为存在性测试。SQL语句通过子查询,使用EXISTS谓词进行存在性测试。
Where [NOT] EXISTS (子查询)
带EXISTS谓词的子查询不返回查询的结果,只产生逻辑真值和逻辑假值。
EXISTS的含义是:当子查询中有满足条件的数据时,EXISTS返回真值,否则返回假值。
NOT EXISTS的含义是:当子查询中有满足条件的数据时,NOT EXISTS返回假值,当子查询中不存在满足条件的数据时,NOT EXISTS返回真值。
30. 游标指针各个参数含义:
NEXT:返回紧跟在当前行之后的数据行,并且当前行递增为结果行。
PRIOR:返回紧跟当前行前面的数据行,并且当前行递减为结果行。
FIRST:返回游标中的第一行并将其作为当前行。
LAST:返回游标中的最后一行并将其作为当前行。
31. 删除架构的T_SQL语句是DROP SCHEMA,语法格式如下:
DROP SCHEMA <架构名> {|}
32. 在SQL Server 2008中,有两种身份验证模式,一种是混合身份验证模式,另一种是Window身份验证模式。
33. 索引视图是一种包含查询结果的数据库对象,其数据不是在视图使用时读取的,而是预先计算好的。
34. 派生性冗余列是指表中增加的列由表中的一些数据项经过计算生成。它的作用是在查询时减少连接操作,避免使用聚合函数。
例如,在销售单据表中,增加总价字段,总价字段是由单价*数目得到的,这种列得到的方式就叫做派生性冗余列
35. 日志文件记录每个事物对数据库的修改操作,数据库系统在运行过程中,将所有事物的修改操作记录到日志文件中。在动态转储中,利用转储文件只能将数据库恢复到转储过程中的某个状态,且转储文件中的数据可能处于不一致状态,只有和日志文件综合起来使用,才能将数据库恢复到一致状态,或将数据库恢复到故障发生前的状态,从而有效地恢复数据库。
36. 分布式数据库系统的恢复控制,最经典的策略是采取两阶段式协议
37. 在关联规则挖掘中,关联规则的成立与否一般用支持度和置信度两个指标进行描述。
大题
后续大题链接:计算机三级数据库大题
第二套
- 完整性约束条件的作用对象分为列、元组和关系三种级别,其中对列的约束主要指对其值类型、范围、精度、排序等的约束条件。对元组的约束主要指对记录中各个属性之间的联系的约束条件。对关系的约束是指对若干纪录间、关系集合上以及关系之间联系的约束条件。
- 在数据文件的非主属性上建立 的索引叫辅索引,唯一加unique
- 如果数据文件中的每个查找码值在索引文件中都对应一个索引记录,则称该索引为稠密索引。
- 论证是否具备数据库应用系统开发所需的人力资源,这属于数据库应用系统的操作可行性分析
- 在进行DBAS设计时,为了避免死锁,可以考虑以下原则:
(1)按同一顺序访问资源。
(2)避免事务中的用户交互。
(3)采用小事务模式,尽量缩短事务的长度,减少占有锁的时间。
(4)尽量使用记录级别的锁(行锁),少用表级别的锁。
(5)使用绑定连接,使同一应用程序所打开的两个或多个连接可以相互合作。 - 元元模型——元模型——模型层——用户模型
- 在数据仓库中,元数据经常被分为 技术元数据 和 业务元数据
- TOP 3应该放在*之前,
- 题面中要求查询工资最低的职工,应该是用MIN函数,故选项CD错误。
选项B中执行子查询之后,外层查询缺少判断部门为基础部的语句。
故答案为A。 - 使用FOR或者AFTER选项定义的触发器为后触发型触发器,即只有在引发触发器执行的语句中的操作都已成功执行,并且所有的约束检查也成功完成后,才执行该触发器。使用INSTEAD OF选项定义的触发器为前触发型触发器,在这种模式的触发器中,指定执行触发器而不是执行引发触发器执行的SQL语句,从而替代触发的操作。
在一个表上针对同一个数据操作只能定义一个前触发器;对于后触发器,可以在同一种操作上建立多个触发器。 - 存储过程可以接受多个输入参数,也可以接受多个输出参数。
- 在调用存储过程时,只需要声明参数的类型,不能指明参数为输出参数。只有再执行时才能指明参数为输出参数。
- 在创建存储过程中可以声明一个或多个参数。
- 除非定义了参数的默认值或者将参数设置为等于另一个参数,否则用户在调用存储过程时必须为每个声明的参数提供值。一个存储过程最多可以有2100个参数。一个存储过程可以有多个输出参数。
删除存储过程的语句为:
DROP { PROC | PROCEDURE } { [schema_name. ] procedure}[,…n]
存储过程的输出可以是一个集合 - 存储过程,实际上是存储在数据库中供所有用户程序调用的子程序。
而不是 存储在客户端中的代码段
存储过程可以进行模块化程序设计
存储过程输入参数的两种传递方式
1)位置传递
2)参数名传递
但是A选项混合了两种,先按位置传递,然后按照参数名传递,错误- 部署图又叫配置图,描述系统中硬件和软件的物理配置情况和系统体系结构。
- 在对游标数据进行提取的过程中,可以使用**@@FETCH_STATUS全局变量判断数据提取的状态**。由于@@FETCH_STATUS对于在一个连接上的所有游标是全局性的,不管是对哪个游标,只要执行一次TETCH语句,系统都会对@@FETCH_STATUS赋一次值,以表明该FETCH语句的执行情況。
- 在SQL Server 2008中用BACKUP关键字进行数据库备份。
- 而关键字DIFFERENTIAL专门改变备份为差异备份。
- 在SQL Server 2008中,系统管理员角色是sysadmin。
- 存储方式中的聚集就是将经常一起使用的多个表中的数据行按照其公共列值存储在一起。
- 在数据仓库的导出数据或物化视图(实视图)的维护策略中,只在用户查询时发现数据已经过期才进行更新的策略称为延时维护策略。
- 水平分割:
(1)是根据数据行的使用特点进行分割 每行至少属于一个片段
(2)分割之后所得的所有表的结构都相同,而存储的数据不同
(3)水平分割会给应用增加复杂度,特别在查询所有数据时需要**Union(并)**操作
(4)大部分是局部使用 不会增加内存空间 - 垂直分割:
(1)是根据列的特点进行分割
(2)分割之后所得的所有表中除了都含有主码列外其余列都不同
(3)查询时会减少I/O次数,但其缺点是查询所有数据时需要**Join (连接)**操作。
第三套
- model数据库用作SQL Server实例上创建的所有数据库的模板。对model数据库进行的修改(如数据库大小、排序规则、恢复模式和其他数据库选项)将应用于以后创建的所有用户数据库,当用户创建一个数据库时,系统自动将model数据库中的全部内容复制到新建数据库中。
- model数据库的空间必须大于master数据库的空间 ×
- 日志文件不包括在文件组内,日志文件和数据文件是分开管理的。
- CREATE PARTITION FUNCTION PFl(int)
AS RANGE RIGHT FOR VALUES (……n):
其中……n用于指定分区的值的数目,所创建的分区数等于n+1。
本题中n值分别为1、100、200,因此可以创建4个分区。由于釆用了RIGHT关键字,在指定分区间隔值是由数据库引擎按升序从左到右排列时,指定边界值处于右侧,即1,100,200属于右侧,因此可以推断出分区的取值范围分别是(0,1),[1,100),[100, 200),[200,∞)。故答案为A。
左边包含等号 - tempdb是临时数据库,用于保存临时对象或中间结果集,并为数据的排序等操作提供一个临时工作空间。每次启动SQL Server时都会重新创建tempdb数据库。
- tempdb用于存放临时信息,用户创建的局部和全局临时表均被自动放置在该数据库中
- 架构(Schema,也称为模式)是数据库下的一个逻辑命名空间,可以存放表、视图等数据库对象。一个数据库可以包含一个或多个架构,架构由特定的授权用户所拥有;在同一个数据库中,架构名必须唯一;架构名可以是显示的,也可以由DBMS提供默认名。故答案为C。
唯一索引的作用是保证索引键值的不重复。
一个表上只能有一个聚集索引(可能引起数据物理排序变化),但是一个表可以有多个唯一索引
一个表中可以同时拥有聚集索引和非聚集索引
在多列唯一索引的情况下,可以确保索引列中每个值的组合都是唯一的。唯一索引和非聚集索引之间没有限定关系。- 分离数据库时需要停用被分离的数据库,但是不需要停用SQL Server服务。正在被访问的数据库不能分离
- 创建分区表通过以下几个步骤实现:(物理操作)
(1)创建分区函数。创建分区函数的目的是告诉数据库管理系统以什么方式对表进行分区。
(2)创建分区方案。分区方案的作用是将分区函数生成的分区映射到文件组中。
(3)使用分区方案创建表。
水平划分将一张基本表划分为多张具有相同属性、结构完全相同的子表。垂直划分则是将一张基本表划分为多张子表,每张子表包含的属性是原基本表的子集。<font color=#3399CC >创建分区表就是对表中数据进行水平划分</font>
分区表中的每个分区必须映射到不同的文件组中 ×
-
对于非聚集索引,数据行的物理排序独立于索引排序。
-
建立索引,会影响表的增删改查操作
-
给用户U1授予更新权限,并不表示同事同时授予了选择权限
-
角色是一组具有相同权限的用户集合。用户定义的角色属于数据库一级的角色,**用户定义的角色的成员可以是数据库的用户,也可以是用户定义的角色。**只要权限没有被拒绝过,则角色中成员的权限就是其所在角色的权限加上他们自己所具有的权限。故答案为A。 -
Oracle的安全控制机制可分为数据库级的安全控制、表级、行级和列级的安全控制。
-
数据库级的安全性通过用户身份认证和授予用户相应系统权限来保证,而表级、行级、列级的安全性是通过授予或回收对象特权保证的。Oracle数据库中的用户按其操作权限大小可分DBA用户和普通用户。故答案为C。
-
数据库管理员可以对数据库用户授权
-
数据库重组是指按照系统设计要求对数据库存储空间进行全面调整,如调整磁盘分区方法和存储空间、重新安排数据的存储、整理回收碎块等,以提高数据库性能。(偏物理)
数据库的重构是指由于数据库应用环境的不断变化,增加了新的应用或新的实体,取消了某些应用,有的实体与实体间的联系也发生了变化等,使得原有的数据库设计不能满足新的需求,此时需要调整数据库的模式和内模式。(升级数据库软件版本)
数据库的重组并不修改数据库原有设计的逻辑结构和物理结构,而数据库的重构则不同,它可以部分修改数据库的模式和内模式。 -
派生性冗余列减少查询时的连接操作
-
除了删除或创建索引,以及非聚簇索引和聚簇索引的相互转换外,通过重建索引可以改进系统的性能。
-
数据库应用系统投入运行标志着系统开发任务的基本完成和系统运行维护工作的开始
-
在三层浏览器/服务器体系的数据库应用系统中,触发器是在数据库服务器上执行的。
-
在UML图中,用于表达系统中不同的包、命名空间或不同的顶目间彼此关系的图称为包图。
-
SQL Server提供了四个排名函数:RANK、DENSE_RANK、NTILE和ROW_NUMBER
其中RANK()函数返回结果集中每个分区内行的序列号,每个分区的第一行从1开始。函数返回结果集中每行数据在每个分区内的排名,并且每个分区内的排名从1开始,但排名中间数值可能有间断。
DENSE_RANK()函数与RANK()函数类似,唯一区别是DENSE_RANK函数排名中间值不间断。 -
单表的联接查询。其语法是:
SELECT 表的别名.列名FROM 表名 表的别名1 JOIN表名 表的别名2
ON 表的别名1.外键=表的别名2.外键
WHERE 查询条件
本题中Student的表有两个别名,分别是Sl,S2。由"Sl.Sname=‘张三’"表明张三是处于别名为S1的表中,那么同一个系的学生所在的表只能是S2。因此在 SELECT后面只能是S2.Sname。
-
在存储过程中输入参数不需要注明,输出参数需要用关键字OUTPUT注明该参数是输出参数
-
将经常一起使用的具有公共列值的多个表中的数据行存储在一起的数据库存储方法被称为聚集。
-
检查点技术的最大特点是最大限度地减少了数据库完成恢复时所必须执行的日志部分。
-
分布式数据库中,位置独立性、数据分片独立性和数据复制独立性形成了分布式数据库系统中的分布透明性,使用户完全感觉不到数据库是分布的,与使用集中式数据库完全一样。
-
对一个数据集的数据进行分组,使得每一组内的数据尽可能相似而不同组间的数据尽可能的不同,这样的数据挖掘方法称为聚类算法。
-
数据仓库是一个面向主题的、集成的、非易失的,且随时间变化的数据集合。
其中,面向主题 -
汽车表中有汽车的基本信息,却没有销售信息;而销售表中有汽车销售信息,没有汽车信息,如果想既知道汽车信息,又知道销售信息,必须将两张表连接进行查询。根据【4】后面的ON关键字提醒,本处应该使用JOIN……ON语法。
连接查询包括内连接和外连接查询。使用内连接时,仅当匹配的内容两个表中都存在时才显示出来。显然内连接不符合题意。因此必须使用外连接。外连接又分为三种类型:
左外连接(LEFT [OUTER] JOIN):结果表中保留连接条件左边关系中的所有内容;
右外连接(RIGHT [OUTER] JOIN):结果表中保留连接条件右边关系中的所有内容;
全外连接(FULL [OUTER] JOIN):结果表中保留连接条件左、右边关系中的所有内容;
其中OUTER关键字可以省略。
题目要求查询包括没有销售和销售的所有的汽车,而汽车表在左边,销售表在右边,因此只有左外连接符合要求。故此处应该填写LEFT JOIN或LEFT OUTER JOIN。
第四套
- 根据监控分析实现的方法不同,监控分析机制分为两种,一种是由数据库系统建立的自动监控机制,另一种是由管理员手动实施的监控机制。
3.
4. 为了提高系统写性能,可以考虑将RAID1改为RAID5 × RAID1写慢读快
5. 数据库 安全性 上升 ,性能 下降
数据库的一致性设计往往以牺牲效率为代价
6. 维护工作主要包括:数据库的转储和恢复;数据库的安全性和完整性控制;数据库性能的监控分析和改进;数据库的重组和重构。
6. 如果运行队列数量超过了CPU处理的数目,服务器性能就会受到CPU的限制而下降,解决方法是为服务器适当增加CPU的数量或者是终止需要许多资源的进程。
7. 模式调整时,符合第一范式要求即可
8. 将数据文件和索引/日志文件放置在同一磁盘上 不利于提高查询效率。 都要放在不同磁盘
9. (易错)
9.
检查点技术大幅度减少了数据库完全恢复时所必须执行的日志部分。
静态转储虽然保证了数据的有效性,但是却是以降低数据库的可用性为代价;
动态转储虽然提高了数据库的可用性,但数据的有效性却可能得不到保障。
差量转储和增量转储相比,速度慢,占用空间较多,但恢复速度比增量转储快。
10. 数据库备份:
1)数据库备份设备可以是磁带也可以是磁盘,
2)数据库备份设备可以为本地设备,也可以使用远程网络设备。
3)SQL Server支持两种备份方式,一种是先建立备份设备,然后再将数据库备份到备份设备上,这样的备份设备称为永久备份设备;另一种是直接将数据库备份到物理文件上,这样的备份设备称为临时备份设备。
4)创建备份设备的 T-SQL存储过程为sp_addumpdevice。
11. 完整备份 是备份特定数据库中所有数据 和 可以恢复这些数据的足够日志;
事务日志备份 仅用于 完整恢复模式 和 大容量日志恢复模式
差异备份包含最近一次完整备份之后发生了更改的数据区
使用差异备份时,应当定期做完整备份
- 事务日志备份仅用于完整恢复模式和大容量日志恢复模式,它并不备份数据库本身,只备份日志记录,而且只备份从上次备份之后到当前备份时间发生变化的日志内容。但是不允许对大容量操作日志备份进行时点恢复。结尾日志备份在出现故障时进行,用于防止丢失数据,可以包含纯日志记录或者大容量操作日志记录,是恢复计划中的最后一个备份。
- 静态转储保证了数据的有效性,却是以降低数据库的可用性为代价的;而动态转储虽然提高了数据库的可用性,但数据的有效性却可能得不到保证。为了既能保证数据的有效性又不会降低数据库的可用性,需要引入日志文件,用它记录转储期间各事务对数据库的修改活动记录,然后使用动态转储的备份副本加上日志文件就可以将数据库恢复到某一时刻的正确状态。所以选项BD错误。(动态转储需要日志文件)
完全转储是对数据库中所有数据进行转储,需占用较多的时间和空间。转储速度并不快,选项C错误。
13.对于用户数据库,简单恢复模式只用于测试和开发数据库,或用于主要包含只读数据的数据库(如数据仓库),这种模式并不适合生产系统,因为对生产系统而言,丢失最新的更改是无法接受的。
16. SQL Server 2008支持数据库、数据文件两个级别的数据恢复。
17. 静态转储可以保证数据的有效性,但是却降低数据库的可用性,动态转储可以提高数据库的可用性,但数据的有效性得不到保证。为了保证数据的一致性,需使用日志文件和动态转储结合使用。在制定备份策略时,需要考虑备份空间、时间等因素。
完全转储是对数据库中所有数据进行转储,此种方式占用较多的时间和空间。
差量转储是对最近一次数据库完全转储以来发生的数据库变化进行转储。差量转储和完全转储相比速度快,占用空间小;差量转储和增量转储相比速度慢、占用空间多,但是恢复速度快。
增量转储只复制上次转储后发生变化的文件或数据块。增量转储所需的时间和空间都比较短,但增量转储数据只能和完全转储配合,才能对数据库进行恢复。增量转储的恢复时间比完全转储要长。故答案为A。
- tempdb只是一个临时数据库,每次SQL Server启动时都会重新新建tempdb数据库。
- 对于非预期的事物内部故障,在保证该事务对其他事务没有影响的条件下,利用日志文件撤销其对数据库的修改,使数据库恢复到该事物运行之前的状态。事务故障的恢复是由系统自动完成的,对用户是透明的。
选项 对于非预期的事务内部故障一般需要管理员人工干预恢复过程 ❌ - 多对多联系——————》非确定性联系
- 数据库中文件结构有:索引文件、顺序文件、堆文件、散列文件和聚集文件。
如果一个数据库中的一个基本表中的数据量很少,并且插入、删除、更新等操作非常频繁,该基本表可以采用堆文件组织方式。 - 用例之间存在关系,包括扩展、使用、组合。扩展和使用是继承关系,即通用化关系的另一种体现形式。组合则是把相关的用例打成包,当作一个整体看待。
- []匹配指定范围内或者属于方括号所指定的集合中的任意单个字符;
_匹配一个字符;
[^]匹配不在方括号之间指定的范围或集合内的任何单个字符;
%匹配包含零个或多个字符的任意字符串。 - 层次结构综合了共享内存、共享磁盘和无共享结构的特点,从全局角度来考虑,可以分为两层,顶层是由若干节点组成的无共享结构,底层是共享内存或共享磁盘结构。
第五套
-
关于数据划分:
——1)根据销售数据划分————》即每个表都拥有完整属性,按照时间段不同,范围划分
——2)数据划分对并行算法的性能有很大的影响
并行数据库仅仅依靠采用多处理器、共享硬件资源等手段无法实现真正意义上的并行处理,只有当数据分布合理、易于并行处理,才能将并行数据库的性能最优化。所以,并行数据库主要依靠多处理器和共享硬件来实现并行处理,数据划分是辅助手段。 × -
聚集函数的并行化计算可以釆取"先分后合"的方法。**
-
位置独立性、数据分片独立性(最高级别的透明性)和数据复制独立性是使分布式数据库具有分布式透明性的主要因素。 喂薯片
-
- 分布式数据库最基本特征是本地自治、非集中式管理及高可用性。 本鸟高非
位置独立性,位置透明性是指数据分片的分配位置对用户是透明的,用户编写程序时只需要考虑数据分片情况,不需要了解各分片在各个场地的分配情况。
数据分片独立性,分片透明性是最高级别的透明性,位于全局模式与分片模式之间。
数据复制独立性,局部数据模型透明性处于分配模式与局部概念模式之间
全局外模式是全局应用的用户视图,即终端用户看到的逻辑上并未分布的表、视图等。
在集中式数据库系统中,查询代价主要是由CPU代价和I/O代价来衡量的,在分布式数据库系统中,由于数据分布在多个不同的场地上,使得查询处理中还要考虑站点间传输数据的通信代价。
- 分布式数据库最基本特征是本地自治、非集中式管理及高可用性。 本鸟高非
-
SaaS,即Software as a Service,中文意思是软件即服务
-
PaaS,即Platform as a Service,中文意思是平台即服务。
-
共享磁盘结构所有的处理机拥有独立的内存,通过互联网共享磁盘。这种结构可以克服共享内存结构,但是由于是通过互联网实现处理器之间的信息交换,会产生一定的通信代价。
-
与传统数据库相比,XML数据库具有以下优势:
(1)XML数据库能够对半结构化数据进行有效的存取和管理。如网页内容就是一种半结构化数据,而传统的关系数据库对于类似网页内容这类半结构化数据无法进行有效的管理。
(2)提供对标签和路径的操作。传统数据库语言允许对数据元素的值进行操作,但不能对元素名称进行操作,半结构化数据库提供了对标签名称的操作,包括对路径的操作。
(3)当数据本身具有层次特征时,由于XML数据格式能够清晰表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作。XML数据库适合管理复杂数据结构的数据集。
现阶段在现实环境中,一边使用的是原有的关系数据库厂商在其传统商业产品中进行了相关的扩充,使其能够处理XML数据的产品。
-
BigTable表的索引是行关键字、列关键字和时间戳,每个单元由行关键字、列关键字和时间戳共同定位。
在BigTable中,不仅可以随意地增减行的数量,同在一定的约束条件下,还可以对列的数量进行扩展。
BigTable数据模型的特点是:
(1)表中的行关键字可以是任意的字符串。
(2)列族是由列关键字组成的集合,是访问控制的基本单位。
(3)时间戳记录了BigTable中每一个数据项所包含的不同版本的数据的时间标识。
允许动态增加列 -
快照是关于指定数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像。快照可以是其所表示的数据的一个副本,也可以是数据的一个复制品。它反映的是某个时间点内的数据,该数据具有不可以改变性。而商场商品销售表、电信公司通话详单属于动态数据,不适合用快照的方式获取数据。故答案为D。
-
数据仓库中数据特征包括面向主题性,集成性,不可更新性,时间特性。面向业务应用、可直接修改、相对OLTP环境性能要求高
-
粒度高(最短)的数据是由粒度低的数据综合而成的。事务执行并发程度越小
-
在进行数据库应用系统需求分析时,需要给出允许并发访问的最大用户数,这属于数据库应用系统的性能需求分析。
-
DFD方法由四种基本元素(模型对象)组成:数据流、处理、数据存储和外部项。
-
活动图主要用于描述系统、用例和程序模块中逻辑流程的先后执行次序,并行次序。
18. SQL Server提供了两种开窗函数:排名开窗函数和聚合开窗函数。 PARTITION BY:将结果集划分为多个分区,OVER子句用于确定在应用关联的开窗函数之前对行集的分区和排序。 -
创建索引的语法格式为:
CREATE [UNIQUE][CLUSTERED|NONCLUSTERED] INDEX index_name
ON (column [ASC|DESC][,…n])
ASC为升序,DESC为降序,默认是ASC,
-
删除登录帐户的T-SQL语句为DROP LOGIN,其语法格式为:
DROP LOGIN login_name -
索引视图是一种保存了查询结果的数据对象,其中数据是预先计算并保存在对象中的。
-
分布式事务管理主要包括恢复控制和并发控制。由于在分布式数据库系统中一个全局事务的完成需要多个场地共同参与,为了保持事务的原子性,参与事务执行的所有场地或者全部提交,或者全部撤消。
-
在数据仓库环境中,粒度是一个重要的设计问题,它影响到数据仓库的数据量以及系统能回答的查询的类型。显然,粒度越小,细节程度越高,能回答的查询就越多。
-
操作型数据存储ODS主要包括即时OLAP和全局型OLTP应用。
第六套
-
设置事务执行时的隔离级别,该任务属于数据库应用系统设计步骤中的物理设计。(事务,二合一表)
-
多对多联系可以写为两个一对多联系,这两个一对多联系属于标定型联系。
-
为了减少连接操作,可以将两个表合成一个表,这项工作属于数据库结构设计中的物理结构设计。
-
1)一个构件或模块只负责完成一项任务,也就是单一责任原则。 √
2)各个构件均应具有独立的功能,并最大限度地减少与其他构件功能重叠。
3)构件之间的接口应尽量简单明确。
4)如果两个构件间的关系比较复杂,应考虑进一步进行模块划分。
5)如果构件过于复杂,可以考虑将其细分。
该阶段的工作是将构件或模块细化,而不是越弄越复杂。关系复杂的构件合并之后会更复杂。
6. -
count()为计数,sum()为求和
-
存储过程的输出参数可以是日期类型的;一个存储过程可以同时拥有输入参数和输出参数,可以拥有多个输入参数和输出参数。
-
instead of是前触发器,for和after是后触发器,触发器的操作是由于插入操作引起的。
-
唯一索引不允许两行具有相同的索引键值。
聚集索引键值的逻辑顺序决定表中对应行的物理顺序。一个表或视图只允许同时有一个聚集索引。 -
允许并发访问的最大用户数——性能需求分析
-
授予用户权限: grant 权限 on 被授予权限的对象 to 要向其授予权限的主体
例子1:授予用户U1在DB1数据库中具有创建表的权限 GRANT CREATE TABLE TO U1 例子2:要注意授予用户创建视图的权限,授予用户U1在表tb1上创建视图的权限 GRANT CREAT VIEW TO U1 例子3:回收创建视图 **无需表明表明,因为创建视图的权限属于语句级授权,而非对象级授权**
-
db_datereader具有查询数据库中所有用户数据的权限,该角色是固定数据库角色,是定义在数据库级别上的,而且存在于每个数据库中。用户不能添加、删除或更改固定数据库角色。(一句话总结:db_datereader是数据库角色,具有查询数据库中所有用户数据的权限)
-
db_datawriter 是数据库角色,具有具有插入、删除和更改数据库中用户数据的权限。
-
RAID1可以避免介质故障带来的影响,RAID0不行。
发生软故障后时,需要在重启系统后,undo所有未提交的事务,并redo所有已提交的事务。
非预期的事务内部故障不能由事务程序处理。
可预期的事务内部故障可以通过将事务回滚,撤销其对数据库的修改,使数据库回到一致性状态。 -
事务日志备份需要日志链完整
-
1)共享内存结构:通过互联网共享一个公共的主存储器,与单机系统的区别是以多个处理器代替单个处理器并行执行事务,通过共享内存传送消息和数据,实现对一个或多个磁盘的访问。
2)共享磁盘结构:所有处理机拥有独立的主存储器,通过互联网共享磁盘。
3)无共享结构:每个处理机拥有独立的主存储器和磁盘,不共享任何资源。高扩展性,适合OLTP结构
4)层次结构:前三种的结合,分两层,顶层无共享结构,底层共享内存或共享磁盘。
**并行数据库系统经常通过负载均衡的方法来提高数据库系统的业务吞吐率。**并行数据库不是分布式数据库!! -
高粒度数据所需的存储空间 和 用户查询所涉及的数据的最高粒度集 次要活或不考虑因素(选高粒度)
-
数据库镜像有三种实现方式,分别是:
1、高可用性:两台服务器上同步事务写入,并支持自动错误恢复。
2、高保护:两台服务器上同步事务写入,但错误恢复是手工的。
3、高性能:两台服务器上的写入可以不同步,因此性能上有所提高,只允许手工的错误恢复。 -
关于数据的数据被称为元数据
-
model数据库是用户数据库模板,大量更新后需要对它备份,新建数据库用户并不需要。
-
事务的隔离性是指多个并发事务同时访问一个数据库时,一个事物不应被另一个事物所干扰,即保证并发读取数据的正确性,降低发生数据不一致的可能性。
第七套
- 在没有建立聚集索引的表上定义主键,系统会自动在主键上建立聚集索引
- 数据库创建后可以手工缩小/扩大数据文件和日志文件的空间
- 完全备份占用空间最大、备份速度最慢但是恢复速度最快;
增量备份占用空间最小、备份速度最快但是恢复速度最慢;
差量备份各方面参数均在前两种备份方法之间。
填空
-
如果一个实体集的每个实例都能被唯一地标识而不决定于它与其他实体集的联系,则被称为独立实体集;如果依赖于与其他实体集的联系,则被称为从属实体集。
-
如果数据文件中的每个查找码值在索引文件中都对应一个索引记录则被称为稠密索引;如果只是一部分查找码的值有对应的索引记录,则被称为稀疏索引。
-
顺序图有两个坐标轴,纵向表示时间的持续过程,横向表示对象。每一个对象用矩形框表示,纵向的虚线表示对象在序列中的执行情况,称为对象的“生命线”。
-
10. -
声明游标的语法是 declare 游标名 cursor for select语句
-
是括号不是点 -
云计算通过集中所有的计算资源,采用硬件虚拟化技术,为云计算使用者提供强大的计算能力、存储和带宽等资源。
-
钻取与卷起是OLAP分析的两个基本操作。钻取是指对应某一维逐步向更细节层方向观察数据,卷起则反之,所以本题应填钻取。
第八套
1.
2. 非标定型联系不会产生从属实体集
3. 根据事务-基本表交叉引用矩阵可以确定哪些事务对哪些表列执行了何种操作,基于该矩阵可以帮助数据库设计人员建立合适的索引
4. 可以同时定义一个由删除和插入功能引起的触发器
5. 聚集索引和非聚集索引建立顺序不影响
6. 数据库所包含的文件与文件存储位置信息均保存在主要数据文件中
7. 根据题目描述,只需要完成I、II即可,因为非介质故障一般只需要执行REDO(重做)和UNDO(回滚)即可。III中RAID是磁盘级别的,数据写入时自动完成备份,即便数据有问题,也将会在驱动程序的协调下自动完成恢复。IV和V是在介质故障时执行的。
8.
第九套
-
数据分布设计 ——物理设计
-
SQL语言中,日期型数据需要使用英文单引号引起
-
触发器通常用于保证业务规则和数据完整性,利用触发器可以实施业务规则
-
赋值要在类型之后 -
SQL Server有两种类型的文件组:主文件组(包含主要数据文件和任何没有明确分配给其他文件组的其他数据文件)和用户定义的文件组(用户可以创建自己的文件组,以将数据文件组织起来,便于管理和数据分配)。
说明:
1)日志文件不包括在文件组内。
2)一个文件不能属于多个文件组
3)如果文件组中有多个文件,则它们在所有文件被填满前不会自动增长,而填满后这些文件会循环增长。(所有文件被填满就会自动增长)
4)一个文件组中的数据文件可以存放在不同磁盘上
5)一个数据库只能有一个主文件组
用户定义的文件组中只能包含次要数据文件 -
一个登录账户可以对应多个数据库用户
-
sa是SQL Server自动创建的数据库系统管理员 见管理员即选
-
元数据 数据字典,ER图,说明文档
第十套
- 对象图、状态机图、时间图均是微观设计的表达方法,包图用于宏观设计。
- 如果运行队列数目超过了CPU处理的数量,说明CPU已饱和,需要适当增加CPU数量或者终止需要许多资源的进程。
链接:https://pan.baidu.com/s/1dKpX7o_eauPIDQPiDyfVeg
提取码:xfet