【软考系统架构设计师】数据库系统章节习题集

最新推荐文章于 2024-09-18 13:33:57 发布

进击的横打

最新推荐文章于 2024-09-18 13:33:57 发布

阅读量2k

点赞数

分类专栏： # 系统架构设计师---章节习题文章标签：系统架构数据库需求分析

本文链接：https://blog.csdn.net/Last_Impression/article/details/122003366

版权

系统架构设计师---章节习题专栏收录该内容

14 篇文章

订阅专栏

【软考系统架构设计师】数据库系统章节习题集

【数据库章节习题集第01题：绿色】
01.在数据库设计的需求分析阶段，业务流程一般采用（）表示。
A.数据流图
B.ER图
C.程序结构图
D.功能模块图

解答：答案选择A。送分题。
数据库设计过程有四个阶段：需求分析，概念结构设计，逻辑结构设计和物理设计。
需求分析阶段的输出有数据流图，数据字典，需求说明书三类。
概念结构设计是设计与具体的DBMs无关的概念结构模型，具体的形式为ER图。
逻辑结构设计的输出是关系模式。包括有视图，完整性约束，应用处理说明书。
物理设计需要联系具体的OS特征以及硬件的特征，聚簇索引在物理设计阶段创建。

【数据库章节习题集第02题：绿色】
02.给定关系模式R=｛A1，A2，A3，A4｝，R上的函数依赖集F=｛A1A3–>A2,A2–>A3}；则R（）。若将R分解为p={(A1,A2), (A1,A3)}，那么该分解（）
A.有一个候选关键字A1A3
B.有一个候选关键字A1A2A3
C.有两个候选关键字A1A3A4和A1A2A4
D.有三个候选关键字A1A3，A1A2和A1A4
》
A.是无损联结的
B.是保持函数依赖的
C.既是无损联结又是保持函数依赖的
D.既是有损连接又不保持函数依赖

解答：答案选择C｜D。二周目蒙对。

首先A1和A4都一定在候选键当中，因为两个的入度都是0。这样第一空只能选C了。
第二空不是无损的，因为提供的A1-A2，A1-A3的话，加上目前的函数依赖，是无法还原到A1A2A3A4都加入进来的场合。
什么是函数依赖？在计算公式中X可以唯一决定Y的值，那么我们就说X函数依赖于Y；而函数依赖包括了部分函数依赖和传递函数依赖两种类型。
什么是部分函数依赖？一般在主键大于1个，且主键的一部分就可以决定非主属性的时候，我们就叫它部分函数依赖；
学号决定系号，系号又可以决定系的名称，这个时候就是传递函数依赖。
在做关系表分解时，一般我们都是要求保持无损分解和保持函数依赖。

【数据库章节习题集第03题：绿色】
03.给定关系模式R<U,F>，其中U为属性集，F是U上的一组函数依赖，那么ArmStrong公理系统的增广率是指（）。
A.若X-Y，X-Z，则X-YX所蕴含。
B. 若X-Y，WY-Z，则XW-Z为F所蕴含。
C. 若X-Y，Y-Z为F所蕴含，则X-Z为F所蕴含。
D.若X-Y为F所蕴含，且Z属于U，则XZ-YZ为F所蕴含

解答：答案选择D。

选项A是合并规则，选项B是偽传递规则，选项C是传递律，选项D是增广律。
自反律是整体可以确定部分的一种规律

【数据库章节习题集第04题：绿色】
04.某集团公司下属有多个超市，假设公司高管需要从时间，地区和商品种类三个维度来分析某电器商品销售数据，那么应采用（）来完成。
A.数据挖掘
B.OLAP
C.OLTP
D.ETL

解答：答案选择B。

OLTP:联机事务处理；传统的关系型数据库
OLAP：联机分析处理数据仓库系统:基本操作：钻取，切片，旋转

【数据库章节习题集第05题：绿色】
05.假设某证券公司的股票交易系统中有正在运行的事务，此时若要转储该交易系统数据库中的全部数据，则应采用（）方式。
A.静态全局转储
B.动态全局转储
C.静态增量转储
D.动态增量转储

解答：答案选择B。

关键字是全部数据，正在运行的事务；所以推测答案就只有B了。

【数据库章节习题集第06题：红色】
06.在分布式数据库中，（）是指各场地数据的逻辑结构对用户不可见。
A.分片透明性
B.场地透明性
C.场地自治
D.局部数据模型透明性

解答：答案选择D。

分片透明性
是指全局数据模式如何分片对用户和应用程序不可见，其只需按全局模式进行操作，是由分布式系统映像到不同的分片上实现。
场地透明
是指用户和应用程序不需要指出对哪个场地上的片段进行操作，场地的变换不会引起用户和应用程序使用上的改变。
场地自治
是指在各个场地上的数据库具有独立处理的能力，可以执行该场地上的局部应用；
局部数据模型透明性
指各个场地上的数据模型（关系模型，非关系模型）和数据的逻辑结构以及选用的DBMS对用户和应用程序是不可见的，用户和应用程序只需要按全局关系模式进行操作，而由分布式数据库系统来实现转换。

【数据库章节习题集第07题：黄色】
07.某数据库中有员工关系E（员工号，姓名，部门，职称，月薪），产品关系（产品号，产品名称，型号，尺寸，颜色）；仓库关系（仓库号，仓库名称，地址，负责人）；库存关系（仓库号，产品号，产品数量）；若数据库中要求如下：
1.仓库关系W中的负责人引用员工关系中的员工号；
2.库存关系I中的《仓库号，产品号》唯一标识i中的每个元素；
3.员工关系E中的职称为工程师的月薪不低于3500元；
则依次要满足的完整性约束是（）
若需得到每种产品的名称和该产品的总库存量，则对应的查询语句为（）
SELECT 产品名称，SUM（产品数量）
FROM P，I
WHERE P.产品号=I.产品号（）
A.实体完整性，参照完整性，用户定义完整性
B.参照完整性，实体完整性，用户定义完整性
C.用户定义完整性，实体完整性，参照完整性
D.实体完整性，用户定义完整性，参照完整性
》
A.ORDER BY 产品名称
B.ORDER BY 产品数量
C.GROUPBY 产品名称
D.GROUP BY 产品数量

解答：答案选择B｜C。

第二空是使用产品名称来进行分组。
使用order by，一般是用来依照查询结果的某一列（或多列）属性，进行排序（升序：ASC；降序：DESC；默认为升序）。
group by按照查询结果集中的某一列（或多列），进行分组，值相等的为一组。
SELECT 投影 FROM 笛卡尔积 WHERE 选择；其中投影是垂直方向，选择是水平方向

No	数据库完整性约束	说明
01	实体完整性	主键，唯一且非空
02	参照完整性	外键，其他关系的主键或者为空
03	用户定义完整性	需要Check，可以使用触发器

【数据库章节习题集第08题：绿色】
08.设有职工实体Employee（职工号，姓名，性别，年龄，通信地址，家庭成员），其中通信地址记录了邮编，省，市，街道信息；家庭成员记录了职工的亲属的姓名，职工实体中的通信地址是一个（）属性；为了将数据库模式设计得更加合理，对于家庭成员属性（）
A.简单
B.复合
C.多值
D.派生
》
A.可以不做任何处理直接记录亲属的姓名
B.只允许记录一个亲属的姓名
C.需要对职工实体设置若干个亲属姓名字段
D.应该将职工的亲属的姓名加上职工号设计成一个独立的实体

解答：答案选择B｜D。
1.复合属性就是还可以再分的属性。通信地址记录了邮编，省，市，街道信息。还有家庭成员是弱实体。
2.规范化理论需要解决的问题有：插入异常，更新异常，删除异常，还有数据冗余的问题。
3.1NF中所有的属性都应该是不可再分的原子值，也就是所有属性都是简单属性，如果属性中有复合属性，也就是可以再分的属性，或者是派生属性（从一个属性可以得出其他的属性），那么它就不满足1NF；
4.2NF是消除了非主属性对候选键的部分函数依赖之后得到；
5.3NF是消除了非主属性对候选键的传递函数依赖之后得到；
6.BCNF：是在第三范式的基础上，消除主属性对候选键的部分函数依赖和传递函数依赖。

【数据库章节习题集第09题：绿色】
09.在关系R｛A1，A2，A3｝和S｛A2，A3，A4｝上进行【投影A1A4（选择A2>2017 And A4=95（R笛卡尔积S））】操作，与该关系表达式等价的是（）。
将该关系模式转换为等价的SQL语句如下：
SELECT FROM R，S WHERE R.A2 < 2017（）。

A.OR A4<95 OR R.A2=S.A2 OR R.A3=S.A3
B. AND A4<95 OR R.A2=S.A2 AND R.A3=S.A3
C. AND A4<95 AND R.A2=S.A2 AND R.A3=S.A3
D. OR A4<95 AND R.A2=S.A2 OR R.A3=S.A3

解答：答案选择D｜C。

【数据库系统章节习题第10题：黄色】
阅读以下关于软件数据建模的说明，在答题纸上回答问题1至问题3。
【说明】
某软件公司成立项目组为某高校开发一套教职工信息管理系统，与教职工相关的信息需求和处理如下：
1）数据需求
在教职工信息中能够存储学校所有在职的教工和职工信息，包括姓名，出生年龄，所属部门，工资编号，工资额，缴税信息等；部门信息中包括部门编号，部门名称，部门人数和办公地点信息。
2）处理需求
能够根据编制内或外教职工的工资编号分别查询其相关信息；每个月的月底统一核发工资，要求系统能以最快速度查询出教工或者职工所在部门名称，实法工资；由于学校人员相对稳定，所以数据变化和维护工作量很少。
项目组王工和李工分别对上面的应用需求给出了所设计的数据模型。
王工遵循数据库设计过程，按照第三范式对数据进行优化和调整，所设计的数据模型简单且基本没有数据冗余；而李工设计的数据模型存在较大的冗余。
项目组经过分析和讨论，特别是针对数据处理中对数据访问效率的需求，最终选择了李工给出的数据模型设计方案。

【问题1】
请用300以内的文字，说明什么是数据库建模中的反规范化技术，指出采用反规范化技术能获得那些益处，可能带来哪些问题。
【问题2】
请简要叙述常见的反规范化技术有哪些
【问题3】
请分析李工是如何应用反规范化技术来满足教职工信息管理需求的。

【问题1标准答案】

规范化设计后，数据库设计者希望牺牲部分规范化来提高性能，这种从规范化设计的回退方法称为反规范化技术。
采用反规范化技术的好处有：降低连接操作的需求，降低外码和索引的数目，还可能减少表的数目，能够提高查询效率。
可能带来的问题：数据的重复存储，浪费了磁盘空间；可能出现数据的完整性问题为了保障数据的一致性，增加了数据维护的复杂性，会降低修改速度。

【问题2标准答案】

增加冗余列
在多个表中保留相同的列，通过增加数据冗余减少或避免连接表的操作。
增加派生列
在表中增加可以由本表或其他表中数据计算生成的列，减少查询时的连接操作并避免计算或使用集合函数。
重新组表
如果许多用户需要查看两个表连接出来的结果数据，则把这两个表重新组成一个表来减少连接提高性能。
水平分割表
根据一列或多列数据的值，把数据放到多个独立的表中，主要用于表数据规模很大，表中数据相对独立，数据需要存放到多个介质上时使用。
垂直分割表
对表进行分割，将主键和部分列放到一个表中，主键与其他列放到另一个表中，在查询时减少了IO次数。

【问题3标准答案】
在教职工信息管理系统的需求中，能够根据编制内或外聘教职工的工资编号分别查询其相关信息，数据查询要求有很高的处理效率。李工所设计的数据模型中采用了三种反规范化技术。

增加冗余列
增加部门名称列，消除了数据查询中教职工信息表和部门信息表之间的连接。
增加派生列
增加实发工资列，消除了实发工资的计算过程。
水平分割表
将教职工信息分割为：编制内教职工信息表和编制外教职工信息表，减少了数据查询的范围

表分区的概念
就是将一个数据量比较大的表，用某种方法把数据从物理上分为若干的小表来存储，从逻辑上看还是一个大表。
分表是真正的生成数据表，是将一张大数据量的表，分成多个小表实现数据均衡。
分区并不是生成新的数据表，而是将表的数据均衡的分摊到不同的硬盘，系统或是不同服务器存储介质中，实际上还是一张表。
分区的策略（分区只有水平方向）

分区方法	说明
范围分区	根据数据库表中某一字段的值的范围来进行划分分区，如年份小于2016年的分成一个区，其他的另一个区
散列分区	根据字段的Hash值进行均匀分布，尽可能的实现各分区所散列的数据相等
列表分区	列表分区明确规定了根据某字段的某个具体值进行分区，而不是像范围分区那样根据字段的值范围来划分的。如长沙武汉分成一个区，北京一个区

分区的优点

相对于单个系统或者硬盘，分区可以存储更多的数据。
数据管理比较方便，比如要清理或废弃某年的数据，就可以直接删除该日期的分区数据即可。
精准定位分区查询数据，不需要全表扫描查询，大大提高数据检索的效率；
可以跨多个分区磁盘查询，从而来提高查询的吞吐量。
在涉及聚合函数查询时，可以很容易的进行数据的合并。

分布透明性
分为水平分片（按记录分片），垂直分片（按字段分片），混合分片。

分布透明性	别名	説明
物理透明性	存储透明性	不需要知道分布式数据库中数据具体放在哪里
逻辑透明性	局部概念透明性	不需要了解数据库的一些概念模式
分片透明性	一	不需要知道分布式数据库中是如何分片或者如何分片存储

NOSQL

分类	典型应用场景	数据模型	优点	缺点	举例
键值	内容缓存，主要用于处理大量数据的高访问负载，也用于一些日志系统	通常用Hash表来实现键值对	查找速度快	数据无结构化通常只被当作字符串或者二进制数据	Redis
列存储数据库	分布式文件系统	以列簇式存储，将同一列数据存在一起	查找速度快，可扩展性强，更容易进行分布式扩展	功能相对局限	HBase
文档型数据库	Web应用（类似于键值）数据库能够了解Value的内容	Key-Value，其中Value是结构化的数据	数据结构要求不严格，表结构可变，不需要像关系数据库一样，需要预先定义表结构	查询性能不高，而且缺乏统一的查询语法	MongoDB
图形数据库	社交网络，推荐系统，专注于构建关系图谱	图结构	利用图结构相关算法	很多时候需要对整个图做计算后才能得出需要的信息，而且这种结构不太好做分布式集群

数据库视图
它是一个虚拟表（在逻辑上），其内容由查询定义（仅保存查询的定义），同真实的表一样，视图包含一系列带有名称的列和行数据，但是视图并没有真正存储这些数据，而是通过查询原始表动态生成所需要的数据。
物化视图：不是传统意义上的虚拟视图，而是实体化的视图，其本身会存储数据。同时当原始表中的数据更新时，物化视图也会更新。
物化视图的局限性：只适合查询较多的数据，对于增删改多的情况，不适合物化视图。
视图的四个优点