【软考系统架构设计师】数据库系统章节习题集

【软考系统架构设计师】数据库系统章节习题集

【数据库章节习题集第01题:绿色】
01.在数据库设计的需求分析阶段,业务流程一般采用()表示。
A.数据流图
B.ER图
C.程序结构图
D.功能模块图

解答:答案选择A。送分题。
数据库设计过程有四个阶段:需求分析,概念结构设计,逻辑结构设计和物理设计。
需求分析阶段的输出有数据流图,数据字典,需求说明书三类。
概念结构设计是设计与具体的DBMs无关的概念结构模型,具体的形式为ER图。
逻辑结构设计的输出是关系模式。包括有视图,完整性约束,应用处理说明书。
物理设计需要联系具体的OS特征以及硬件的特征,聚簇索引在物理设计阶段创建。

【数据库章节习题集第02题:绿色】
02.给定关系模式R={A1,A2,A3,A4},R上的函数依赖集F={A1A3–>A2,A2–>A3};则R()。若将R分解为p={(A1,A2), (A1,A3)},那么该分解()
A.有一个候选关键字A1A3
B.有一个候选关键字A1A2A3
C.有两个候选关键字A1A3A4和A1A2A4
D.有三个候选关键字A1A3,A1A2和A1A4

A.是无损联结的
B.是保持函数依赖的
C.既是无损联结又是保持函数依赖的
D.既是有损连接又不保持函数依赖

解答:答案选择C|D。二周目蒙对。

  1. 首先A1和A4都一定在候选键当中,因为两个的入度都是0。这样第一空只能选C了。
  2. 第二空不是无损的,因为提供的A1-A2,A1-A3的话,加上目前的函数依赖,是无法还原到A1A2A3A4都加入进来的场合。
  3. 什么是函数依赖?在计算公式中X可以唯一决定Y的值,那么我们就说X函数依赖于Y;而函数依赖包括了部分函数依赖和传递函数依赖两种类型。
  4. 什么是部分函数依赖?一般在主键大于1个,且主键的一部分就可以决定非主属性的时候,我们就叫它部分函数依赖;
  5. 学号决定系号,系号又可以决定系的名称,这个时候就是传递函数依赖。
  6. 在做关系表分解时,一般我们都是要求保持无损分解和保持函数依赖。

【数据库章节习题集第03题:绿色】
03.给定关系模式R<U,F>,其中U为属性集,F是U上的一组函数依赖,那么ArmStrong公理系统的增广率是指()。
A.若X-Y,X-Z,则X-YX所蕴含。
B. 若X-Y,WY-Z,则XW-Z为F所蕴含。
C. 若X-Y,Y-Z为F所蕴含,则X-Z为F所蕴含。
D.若X-Y为F所蕴含,且Z属于U,则XZ-YZ为F所蕴含

解答:答案选择D。

  1. 选项A是合并规则,选项B是偽传递规则,选项C是传递律,选项D是增广律。
  2. 自反律是整体可以确定部分的一种规律

【数据库章节习题集第04题:绿色】
04.某集团公司下属有多个超市,假设公司高管需要从时间,地区和商品种类三个维度来分析某电器商品销售数据,那么应采用()来完成。
A.数据挖掘
B.OLAP
C.OLTP
D.ETL

解答:答案选择B。

  1. OLTP:联机事务处理; 传统的关系型数据库
  2. OLAP:联机分析处理 数据仓库系统:基本操作:钻取,切片,旋转
    在这里插入图片描述

【数据库章节习题集第05题:绿色】
05.假设某证券公司的股票交易系统中有正在运行的事务,此时若要转储该交易系统数据库中的全部数据,则应采用()方式。
A.静态全局转储
B.动态全局转储
C.静态增量转储
D.动态增量转储

解答:答案选择B。

  1. 关键字是全部数据,正在运行的事务;所以推测答案就只有B了。

【数据库章节习题集第06题:红色】
06.在分布式数据库中,()是指各场地数据的逻辑结构对用户不可见。
A.分片透明性
B.场地透明性
C.场地自治
D.局部数据模型透明性

解答:答案选择D。

  1. 分片透明性
    是指全局数据模式如何分片对用户和应用程序不可见,其只需按全局模式进行操作,是由分布式系统映像到不同的分片上实现。
  2. 场地透明
    是指用户和应用程序不需要指出对哪个场地上的片段进行操作,场地的变换不会引起用户和应用程序使用上的改变。
  3. 场地自治
    是指在各个场地上的数据库具有独立处理的能力,可以执行该场地上的局部应用;
  4. 局部数据模型透明性
    指各个场地上的数据模型(关系模型,非关系模型)和数据的逻辑结构以及选用的DBMS对用户和应用程序是不可见的,用户和应用程序只需要按全局关系模式进行操作,而由分布式数据库系统来实现转换。

【数据库章节习题集第07题:黄色】
07.某数据库中有员工关系E(员工号,姓名,部门,职称,月薪),产品关系(产品号,产品名称,型号,尺寸,颜色);仓库关系(仓库号,仓库名称,地址,负责人);库存关系(仓库号,产品号,产品数量);若数据库中要求如下:
1.仓库关系W中的负责人引用员工关系中的员工号;
2.库存关系I中的《仓库号,产品号》唯一标识i中的每个元素;
3.员工关系E中的职称为工程师的月薪不低于3500元;
则依次要满足的完整性约束是()
若需得到每种产品的名称和该产品的总库存量,则对应的查询语句为()
SELECT 产品名称,SUM(产品数量)
FROM P,I
WHERE P.产品号=I.产品号()
A.实体完整性,参照完整性,用户定义完整性
B.参照完整性,实体完整性,用户定义完整性
C.用户定义完整性,实体完整性,参照完整性
D.实体完整性,用户定义完整性,参照完整性

A.ORDER BY 产品名称
B.ORDER BY 产品数量
C.GROUPBY 产品名称
D.GROUP BY 产品数量

解答:答案选择B|C。

  1. 第二空是使用产品名称来进行分组。
  2. 使用order by,一般是用来依照查询结果的某一列(或多列)属性,进行排序(升序:ASC;降序:DESC;默认为升序)。
  3. group by按照查询结果集中的某一列(或多列),进行分组,值相等的为一组。
  4. SELECT 投影 FROM 笛卡尔积 WHERE 选择;其中投影是垂直方向,选择是水平方向
No数据库完整性约束说明
01实体完整性主键,唯一且非空
02参照完整性外键,其他关系的主键或者为空
03用户定义完整性需要Check,可以使用触发器

【数据库章节习题集第08题:绿色】
08.设有职工实体Employee(职工号,姓名,性别,年龄,通信地址,家庭成员),其中通信地址记录了邮编,省,市,街道信息;家庭成员记录了职工的亲属的姓名,职工实体中的通信地址是一个()属性;为了将数据库模式设计得更加合理,对于家庭成员属性()
A.简单
B.复合
C.多值
D.派生

A.可以不做任何处理直接记录亲属的姓名
B.只允许记录一个亲属的姓名
C.需要对职工实体设置若干个亲属姓名字段
D.应该将职工的亲属的姓名加上职工号设计成一个独立的实体

解答:答案选择B|D。
1.复合属性就是还可以再分的属性。通信地址记录了邮编,省,市,街道信息。还有家庭成员是弱实体。
2.规范化理论需要解决的问题有:插入异常,更新异常,删除异常,还有数据冗余的问题。
3.1NF中所有的属性都应该是不可再分的原子值,也就是所有属性都是简单属性,如果属性中有复合属性,也就是可以再分的属性,或者是派生属性(从一个属性可以得出其他的属性),那么它就不满足1NF;
4.2NF是消除了非主属性对候选键的部分函数依赖之后得到;
5.3NF是消除了非主属性对候选键的传递函数依赖之后得到;
6.BCNF:是在第三范式的基础上,消除主属性对候选键的部分函数依赖和传递函数依赖。

【数据库章节习题集第09题:绿色】
09.在关系R{A1,A2,A3}和S{A2,A3,A4}上进行【投影A1A4(选择A2>2017 And A4=95(R笛卡尔积S))】操作,与该关系表达式等价的是()。
将该关系模式转换为等价的SQL语句如下:
SELECT FROM R,S WHERE R.A2 < 2017()。
在这里插入图片描述
A.OR A4<95 OR R.A2=S.A2 OR R.A3=S.A3
B. AND A4<95 OR R.A2=S.A2 AND R.A3=S.A3
C. AND A4<95 AND R.A2=S.A2 AND R.A3=S.A3
D. OR A4<95 AND R.A2=S.A2 OR R.A3=S.A3

解答:答案选择D|C。

【数据库系统章节习题第10题:黄色】
阅读以下关于软件数据建模的说明,在答题纸上回答问题1至问题3。
【说明】
某软件公司成立项目组为某高校开发一套教职工信息管理系统,与教职工相关的信息需求和处理如下:
1)数据需求
在教职工信息中能够存储学校所有在职的教工和职工信息,包括姓名,出生年龄,所属部门,工资编号,工资额,缴税信息等;部门信息中包括部门编号,部门名称,部门人数和办公地点信息。
2)处理需求
能够根据编制内或外教职工的工资编号分别查询其相关信息;每个月的月底统一核发工资,要求系统能以最快速度查询出教工或者职工所在部门名称,实法工资;由于学校人员相对稳定,所以数据变化和维护工作量很少。
项目组王工和李工分别对上面的应用需求给出了所设计的数据模型。
王工遵循数据库设计过程,按照第三范式对数据进行优化和调整,所设计的数据模型简单且基本没有数据冗余;而李工设计的数据模型存在较大的冗余。
项目组经过分析和讨论,特别是针对数据处理中对数据访问效率的需求,最终选择了李工给出的数据模型设计方案。
在这里插入图片描述
【问题1】
请用300以内的文字,说明什么是数据库建模中的反规范化技术,指出采用反规范化技术能获得那些益处,可能带来哪些问题。
【问题2】
请简要叙述常见的反规范化技术有哪些
【问题3】
请分析李工是如何应用反规范化技术来满足教职工信息管理需求的。

  • 【问题1标准答案】
  1. 规范化设计后,数据库设计者希望牺牲部分规范化来提高性能,这种从规范化设计的回退方法称为反规范化技术。
  2. 采用反规范化技术的好处有:降低连接操作的需求,降低外码和索引的数目,还可能减少表的数目,能够提高查询效率。
  3. 可能带来的问题:数据的重复存储,浪费了磁盘空间;可能出现数据的完整性问题 为了保障数据的一致性,增加了数据维护的复杂性,会降低修改速度。
  • 【问题2标准答案】
  1. 增加冗余列
    在多个表中保留相同的列,通过增加数据冗余减少或避免连接表的操作。
  2. 增加派生列
    在表中增加可以由本表或其他表中数据计算生成的列,减少查询时的连接操作并避免计算或使用集合函数。
  3. 重新组表
    如果许多用户需要查看两个表连接出来的结果数据,则把这两个表重新组成一个表来减少连接提高性能。
  4. 水平分割表
    根据一列或多列数据的值,把数据放到多个独立的表中,主要用于表数据规模很大,表中数据相对独立,数据需要存放到多个介质上时使用。
  5. 垂直分割表
    对表进行分割,将主键和部分列放到一个表中,主键与其他列放到另一个表中,在查询时减少了IO次数。
  • 【问题3标准答案】
    在教职工信息管理系统的需求中,能够根据编制内或外聘教职工的工资编号分别查询其相关信息,数据查询要求有很高的处理效率。李工所设计的数据模型中采用了三种反规范化技术。
  1. 增加冗余列
    增加部门名称列,消除了数据查询中教职工信息表和部门信息表之间的连接。
  2. 增加派生列
    增加实发工资列,消除了实发工资的计算过程。
  3. 水平分割表
    将教职工信息分割为:编制内教职工信息表和编制外教职工信息表,减少了数据查询的范围
  • 表分区的概念
    就是将一个数据量比较大的表,用某种方法把数据从物理上分为若干的小表来存储,从逻辑上看还是一个大表。
    分表是真正的生成数据表,是将一张大数据量的表,分成多个小表实现数据均衡。
    分区并不是生成新的数据表,而是将表的数据均衡的分摊到不同的硬盘,系统或是不同服务器存储介质中,实际上还是一张表。

  • 分区的策略(分区只有水平方向)

分区方法说明
范围分区根据数据库表中某一字段的值的范围来进行划分分区,如年份小于2016年的分成一个区,其他的另一个区
散列分区根据字段的Hash值进行均匀分布,尽可能的实现各分区所散列的数据相等
列表分区列表分区明确规定了根据某字段的某个具体值进行分区,而不是像范围分区那样根据字段的值范围来划分的。如长沙武汉分成一个区,北京一个区
  • 分区的优点
  1. 相对于单个系统或者硬盘,分区可以存储更多的数据。
  2. 数据管理比较方便,比如要清理或废弃某年的数据,就可以直接删除该日期的分区数据即可。
  3. 精准定位分区查询数据,不需要全表扫描查询,大大提高数据检索的效率;
  4. 可以跨多个分区磁盘查询,从而来提高查询的吞吐量。
  5. 在涉及聚合函数查询时,可以很容易的进行数据的合并。
  • 分布透明性
  • 分为水平分片(按记录分片),垂直分片(按字段分片),混合分片。
分布透明性别名説明
物理透明性存储透明性不需要知道分布式数据库中数据具体放在哪里
逻辑透明性局部概念透明性不需要了解数据库的一些概念模式
分片透明性不需要知道分布式数据库中是如何分片或者如何分片存储
  • NOSQL
分类典型应用场景数据模型优点缺点举例
键值内容缓存,主要用于处理大量数据的高访问负载,也用于一些日志系统通常用Hash表来实现键值对查找速度快数据无结构化通常只被当作字符串或者二进制数据Redis
列存储数据库分布式文件系统以列簇式存储,将同一列数据存在一起查找速度快,可扩展性强,更容易进行分布式扩展功能相对局限HBase
文档型数据库Web应用(类似于键值)数据库能够了解Value的内容Key-Value,其中Value是结构化的数据数据结构要求不严格,表结构可变,不需要像关系数据库一样,需要预先定义表结构查询性能不高,而且缺乏统一的查询语法MongoDB
图形数据库社交网络,推荐系统,专注于构建关系图谱图结构利用图结构相关算法很多时候需要对整个图做计算后才能得出需要的信息,而且这种结构不太好做分布式集群
  • 数据库视图
  • 它是一个虚拟表(在逻辑上),其内容由查询定义(仅保存查询的定义),同真实的表一样,视图包含一系列带有名称的列和行数据,但是视图并没有真正存储这些数据,而是通过查询原始表动态生成所需要的数据。
  • 物化视图:不是传统意义上的虚拟视图,而是实体化的视图,其本身会存储数据。同时当原始表中的数据更新时,物化视图也会更新。
  • 物化视图的局限性:只适合查询较多的数据,对于增删改多的情况,不适合物化视图。
  • 视图的四个优点
  1. 简化用户操作
  2. 使用户可以用多个角度看待同一问题
  3. 对重构数据库提供了一定的逻辑独立性
  4. 可以对机密数据提供安全保护
  • 视图的缺点:查询之后再来展示,所以效率较低
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

进击的横打

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值