三级数据库杂记

最新推荐文章于 2024-10-14 22:42:36 发布

梁小憨憨

最新推荐文章于 2024-10-14 22:42:36 发布

阅读量354

点赞数

分类专栏：计算机等级考文章标签：数据库

本文链接：https://blog.csdn.net/qq_41990294/article/details/104979676

版权

计算机等级考专栏收录该内容

3 篇文章 0 订阅

订阅专栏

计算机三级知识点整理，边刷题边总结，考试之前复习用，文章括号内容是根据自己的记忆习惯编写的助记词，作者是数据库小白！！！

计算机三级数据库

第一章　数据库应用系统开发方法
- 数据库应用系统生命周期图
- 知识杂记
第二章　需求分析
第三章数据库结构设计

第一章　数据库应用系统开发方法

数据库应用系统生命周期图

本章的知识点一此图展开
在这里插入图片描述

5个基本活动：项目规划、需求分析、系统设计、实现与部署、运行与维护
3条设计主线：数据组织与存储、数据访问与处理、应用程序
3个设计步骤：概念设计、逻辑设计、物理设计

知识杂记

系统规划和定义的内容:任务陈述（背景）、确定任务目标（就是目标）、确定系统范围和边界（路）、确定用户视图（最终图画）。

数据库应用系统的需求分析：数据需求分析、功能需求分析(数据处理需求分析、业务规则需求分析)、性能需求分析(数据操作响应时间或数据访问响应时间、系统吞吐量、允许并发访问的最大用户数、每秒TPS代价值)、其他需求分析(存储需求分析、安全性需求分析、备份和恢复需求分析)。

DBAS的性能指标有:
①数据操作响应时间(或数据访问响应时间):从提交请求到返回结果的时间;
②系统吞吐量:指系统在单位时间内所完成的事务或查询的数量，单位为TPS;
③允许并发访问的最大用户数:在保证响应时间的前提下，系统最多允许多少用户同时访问数据库;
④每TPS代价值，用于衡量系统性价(性能价格)比的指标。

数据库概念设计的目标:定义和描述应用领域涉及的数据范围;获取应用领域或问题域的信息模型;描述清楚数据的属性特征;描述清楚数据之间的关系;定义和描述数据的约束;说明数据的安全性要求;支持用户的各种数据处理需求;保证信息模型方便地转换成数据的逻辑结构(数据库模式)，同时也便于用户理解。

概念数据模型：主要用来描述世界的概念化结构，它使数据库设计人员在设计的初始阶段摆脱计算机系统及DBMS的具体技术问题，集中精力分析数据以及数据之间的联系等，与具体的数据库管理系统无关，所以没有描述数据的完整性约束条件。

数据库应用系统逻辑设计阶段工作内容分为三部分:数据库逻辑结构设计、数据库事务概要设计、应用程序概要设计。

物理设计阶段的主要活动有:确定存储结构、存取路径的选择和调整、确定数据存放位置和确定存储分配。

数据库物理设计阶段的目标：设计一个存储空间占用少、数据访问率高和维护代价低的数据库物理模式。

物理模式评估：对数据库物理设计结果从时间、空间和维护等方面进行评估，从多种可行方案中选择合理的数据库物理结构。

数据库实施阶段包括:建立数据库结构、数据加载、事务和应用程序的编码及测试、系统集成、测试与试运行、系统部署。（红酒杯）

数据库的三级模式：外模式、模式和內模式，模式的三个级别层次反映了模式的三个不同环境以及它们的不同要求。其中内模式处于最低层，它反映了数据在计算机物理结构中的实际存储形式。模式处于中层，它反映了设计者的数据全局逻辑要求。外模式也称用户模式，处于最外层，它反映了用户对数据的要求。数据库系统的三级模式是对数据的三个级别的抽象，它把数据的具体物理实现留给物理模式，使用户与全局设计者不必关心数据库的具体实现与物理背景。

数据库的二级映像：模式到内模式的映射以及外模式到模式的映射。通过两级映射建立三级模式间的联系与转换，使得模式与外模式虽然并不具备物理存在，但是也能通过映射而获得其存在的实体。两级映射也保证了数据库系统中数据的独立性，亦即数据的物理组织改变与逻辑概念改变不影响用模式，只需调整映射方式即可。模式内模式保证了数据库中数据与应用程序间的物理独立性，而外模式模式保证了数据与应用程序间的逻辑独立性。

关系模式与关系：关系模式描述关系的静态结构，它是静态、稳定的，而关系是动态、随用户对数据库的操作而变化的。

属性的值：一个属性的值必须属于唯一的域，域在这里相当于数据类型的子集，属性的取值必须为同一域。标识属性的值不能重复且不可以为空。

数据字典：对系统中各类数据描述的集合,是进行详细的数据收集和数据分析所获得的主要成果。数据字典在数据库设计中占有很重要的地位，通常包括数据项（项，项目，目录）、数据结构（目录的结构）、数据流、数据存储和处理过程5个部分。

视图：从一个或几个基本表(或视图)中导出的虛表，数据库中只存放了视图的定义，不存放视图对应的数据。它是原始数据库数据的一种变换，是查看表中数据的另外-种方式。可以将视图看成是一个移动的窗口，通过它可以看到感兴趣的数据。视图是从一个或多个实际表中获得的，这些表的数据存放在数据库中。那些用于产生视图的表叫做该视图的基表。-个视图也可以从另一个视图中产生。

视图的特点:①简单性，看到的就是需要的。视图不仅可以简化用户对数据的理解;也可以简化对它们的操作。那些被经常使用的查询可以被定义为视图，从而使得用户不必为以后的操作每次指定全部的条件;②安全性，通过视图用户只能查询和修改他们所能见到的数据。数据库中的其它数据则既看不见也取不到:③逻辑数据独立性，视图可帮助用户屏蔽真实表结构变化带来的影响;

视图的作用:①简化数据查询语句;②使用户从多角度看待同一数据;③提高数据安全性;④提供了-定程度的逻辑独立性。

不同的数据库管理系统有着不同的逻辑实现结构，因此数据库空间管理办法随数据库管理系统不同而不同。

数据库完整性包括实体完整性、参照完整性和用户自定义完整性。
①实体完整性在CREATE TABLE中用PRIMARY KEY(主码)定义。primary foreign
②参照完整性在CREATE TABLE中用FOREIGN KEY(外码)短语定义哪些列为外码，用REFERENCES短语指明这些外码参照哪些表的主码。
③用户自定义完整性在CREATE TABLE中定义属性的同时也可以根据应用要求，定义属性上的约束条件，即属性值限制，包括:列值非空(NOT NULL)，列值唯一一(UNQUE)，检查列值是否满足-个布尔表达式( CHECK短语)。

GRANT关键字是属于定义数据库安全性的语句，主要用于将某些对数据库的操作权限授予某个用户。

瀑布模型6个阶段的任务可知，瀑布模型是基于严格的、明确的需求作为软件系统开发基础的软件开发模型

快速原型模型是一种快速开发方法，其指导思想是不必把前期各阶段的活动做得尽善尽美后才启动下阶段的活动;

螺旋模型是将瀑布模型的系统化与快速模型的可修改性结合起来，引入风险评估活动。

第二章　需求分析

需求分析主要包括数据需求分析、数据处理需求分析、功能需求分析(数据处理需求分析与业务规则需求分析)、性能需求分析和其它需求分析。
①数据处理需求分析:从对数据组织与存储的设计角度，辨识应用领域所管理的各类数据项和数据结构，与数据处理需求分析结果一起，组成数据字典，形成"数据规范说明书”。
②功能需求分析:功能需求分析主要针对DBAS应具有的功能进行分析，是DBAS需求分析的核心环节，总体上可分为数据处理需求分析与业务规则需求分析。数据处理需求分析从数据访问和处理的角度，明确对各数据项所需要进行的数据访问操作。在系统规划与分析阶段，DBAS开发者已经明确了各类用户视图。因此数据处理需求分析阶段可以从这些视图出发，针对每个用户视图进行数据处理需求分析，然后汇总各个视图的分析结果得到对系统的完整分析结果。
③性能需求分析:性能需求则描述了系统应当做到什么程度，分析DBAS应具有的性能指标。
④其他需求分析包括:存储需求、安全性需求等。
a存储需求分析:存储需求分析是指估计DBAS系统需要的数据存储量，如DB所存储的数据总量。
b.安全需求分析:主要用于数据库安全设计，避免被非法使用和攻击。

数据流图(Data Flow Diagram,简称DFD):便于用户理解系统数据流程的图形表示。DFD建模方法的核心是数据流，它能精确地在逻辑上描述系统的功能、输入、输出和数据存储等，从而摆脱了其物理内容。数据流图是系统逻辑模型的重要组成部分。
DFD特性:
①抽象性:在DFD中具体的组织机构、工作场所、物质流等都已经去掉，只剩下信息和数据存储、流动、使用以及加工的情况。所以描述的是抽象出来的数据。
②概括性:它把系统对各种业务的处理过程联系起来考虑，形成一个总体，可反映出数据流之间的概括情况。

常用的需求建模方法包括:①DFD方法;②IDEF0方法;③UML方法。

DFD图采用自顶向下逐步细化的结构化分析方法。DFD即数据流图，它是由数据流、
(对数据的加工)处理、数据存储和外部项组成。

在DFD建模方法中，数据流用箭头表示，处理用矩形框表示，数据存储用圆角矩形框表示，外部项用圆角框或者平行四边形框表示。

IDEF0图:基本元素是矩形框和箭头，矩形框内的动词短语描述功能活动的名称，活动的编号按要求写在矩形框右下角指定的位置。

左边的输入箭头表示完成活动需要的数据;
上方的控制箭头描述了影响这个活动执行的事件或约束条件;
右边的输出箭头说明由此活动产生的结果集信息;
下方进入的机制箭头表示实施该活动的物理手段或完成活动所需要的资源(计算机系统、人或组织)

第三章数据库结构设计

数据模型的构成：通常由数据结构、数据操作和完整性约束三部分构成。
数据的完整性约束是一组完整性规则，它是给定的数据模型中数据及其联系所有的制约和依存的规则，用以限定符合数据模型的数据库状态及状态的变化，以保证数据的正确、有效、相容。
实体的完整性规定，主码的任何属性都不能为空，因为概念模型中实体和联系都是可区分的，而且它们以主码为唯一性标识。

ER模型：设计数据库时，要分析这个数据库必须存储的信息及这些信息组成部分之间的关系，ER模型就是用来描述数据库中实体及其属性以及各个实体间联系的描述方法。
ER模型建模时，不考虑数据库在计算机中的存储和处理特性。
设计ER图是概念设计阶段的产物。

ER图向关系模式转换涉及到两方面:实体的转换和实体间联系的转换。
①实体的转换:在从ER图转换为关系模式时，一个实体就转换成一个关系模式，实体的属性就是关系模式的属性，实体的键就是关系的主键。
②实体间联系的转换:实体间存在三种联系，即1:1 (一对一)联系,1:m(- -对多)联系，m:n
(多对多)联系。在从ER向关系模式转换规则如下:
1:1 (一对一)联系
方法一:联系转换为独立的关系模式;模式的属性由联系本身的属性及两个实体的键构成;主键由两个实体中的任意- -个键构成。
方法二:联系与端的实体的关系模式合并，即将联系的属性加入到实体的关系模式内，主键不变。 1:m (一对多)联系
方法一:联系转换为独立的关系模式;模式的属性由联系本身的属性及两个实体的键构成;主键由n端实体的键组成。
方法二:与n端的实体的关系模式合并，即将联系的属性加入到实体的关系模式内，主键不变。 m:n(多对多)联系
多对多联系转换成新的独立的模式时，模式的属性由联系本身的属性及两个实体的键构成，主键由两端实体的键组合而成。
由题目可知，该题中有三个实体、一-个1:1 (一对一)联系、三个1:m (一对多)联系和一-个m:n (多对多)联系。三个实体和一个m:n(多对多)联系可以转换为单独的模式，1:1 (一对一)联系和一-对1:m
(一对多)联系需要合并到实体中去。因此可以最终得到四个模式，即三个实体(员工，部门，项目)和- -个多对多联系。

逻辑设计的主要工作是将现实世界的概念数据模型设计成数据库的一种逻辑模式，即适应于某种特定数据库管理系统所支持的逻辑数据模式。
与此同时，可能还需为各种数据处理应用领域产生相应的逻辑子模式，这一步设计的结果就是所谓的"逻辑数据库"。
ER图到关系模式的转换和定义数据的约束条件都是在逻辑设计层面上的操作。

数据库 逻辑设计的 目标是得到 实际的数据库管理系统可处理的数据库模式，各模式结构合理,数据之间 不存在不合理的数据依赖关系，且满足各类应用的处理和使用要求，为数据库的物理设计及数据库高效、正确地运行打下基础。在 优化关系模式中需根据应用规范化理论逐一 检查每一个 关系模式，使之 满足3NF。

数据库物理设计阶段活动包括:
①数据库逻辑模式调整;(打通上一层)
②选择或配置基本关系表的文件组织形式，为基本关系表设计数据存取方法或存取路径;（交通工具，路线）
③数据分布设计;（分岔路）
④安全模式设计;（转弯安全）
⑤确定系统配置;（车的配置）
⑥物理模式评估。（流程评估）

数据库物理设计的目的是将数据的逻辑模式转换为实现技术规范，其目标是设计数据存储方案，以便提供足够好的性能并确保数据库数据的完整性、安全性和可恢复性。通常，数据库物理设计并不包括文件和数据库的具体实现细节(例如如何创建文件、建立数据库以及如何加载数据等)。

内模式也称存储模式，它是数据物理结构和存储方式的描述，是数据在数据库内部的表示方式，一个数据库只有一个内模式。
外模式可以有多个，其是应用程序或用户与数据库通信的接口，不同的用户访问同一个数据库对应多个外模式。
数据与程序之间的独立性，使数据定义与描述分离，所有数据的存取由DBMS管理，用户不必考虑存取细节，所以减少了应用程序的维护。

对模式进行分解时，既要保证分解具有"无损连接性”，又要保证分解"保持函数依赖"。
"无损连接"指分解的若干连接重组时可以精确恢复到原来的数据表，数据记录既没有增加也没有减少。
"保持函数依赖"是指原关系模式含有的属性之间的隐含关系在分解后不能丢失。
分解使得一个关系变为多个关系，常用于关系模式规范化。-般情况下可以减少部分数据冗余，但不恰当的分解，也可能增加冗余。

一张关系表中的主码不能为空且具有唯一性。外码取值可能为被参照关系中已存在的主码值或空值。

SQL Server实例就是在数据库中存在的现实的数据库例子，它是后台进程和数据库文件的集合。
仅具有登录权限的用户对SQL Server只能进行系统数据库中有关SQL Server的一些系统信息的查询，即只能对master、 msdb数据库部分数据进行查询。

数据模型三个要素包括:
①数据结构
数据结构是所研究的对象类型的集合。它从语法角度表述了客观世界中数据对象本身的结构和数据对象之间的关联关系，是对系统静态特征的描述。
②数据操作
数据操作是对数据库中对象的实例允许执行的操作的集合，主要指检索和更新(插入、删除、修改)两类操作。数据模型必须定义这些操作的确切含义、操作符号、操作规则(如优先级)以及实现操作的语言。数据操作是对系统动态特性的描述。
③数据完整性约束
数据完整性约束是一组完整性规则的集合,规定数据库状态及状态变化所应满足的条件，以保证数据的正确性、有效性和相容性。

根据索引的实现方式，索引技术被分成两大类:有序索引和散列索引。

索引的分类：
稀疏索引是指如果只是一部分查找码的值有对应的索引记录，则该索引为稀疏索引;
稠密索引是指如果数据文件中的每一个查找码值在索引文件中都对应-个索引记录，则该索引为稠密索引。
聚集索引、非聚集索引：对于数据文件和它的一-个特定的索引文件，如果数据文件中的数据记录的排列顺序与索引文件中索引项的排列顺序相致，或者说，索引文件按照其查找码指定的顺序与数据文件中数据记录的排列顺序相一-致，则该索引文件称为聚集索引，聚集索引的键值可以重复，否则为非聚集索引。

对于复合索引，在查询使用时，最好将where条件顺序作为索引的顺序。

稀疏索引属于有序索引，所以所指向的数据文件- -定是有序的。

唯一索引可以确保索引列不包含重复值的值， unique表示唯一索引。在数据文件的 非主属性上建立的索引称为 辅索引。

聚集索引确定表中数据的 物理顺序。由于聚集索引规定数据在表中的物理存储顺序，因此一个表只能包含 一个聚集索引。
非聚集索引与课本中的 目录类似，数据存储在一个地方，索引存储在另一个地方，索引带有指针指向数据的存储位置，一个表可以有 多个非聚集索引。
当对表中的 数据进行增加、删除和 修改的时候， 索引也要 动态的维护，这样就 降低了数据的 维护速度。

分布式数据要达到的目标是:本地自治、非集中式管理、高可用性、位置独立性、数据分片独立性、数据复制独立性、分布式查询处理、分布式事务管理、硬件独立性、操作系统独立性、网络独立性、数据库管理系统独立性。

并行数据库的目标是高性能和高可用性，通过多个处理节点并行执行数据库任务，提高整个数据库系统的性能和可用性。

数据库吞吐量指的是系统在单位时间可以完成的数据库事务数量。

文件结构：
散列文件：指利用散列存储方式组织的文件，亦称为直接存取文件。散列文件的优点是:文件随机存放，记录不需进行排序;插入、删除方便;存取速度快;不需要索引区，节省存储空间。其缺点是:不能进行顺序存取，只能按关键字随机存取，且询问方式只限于简单询问，并且在经过多次插入、删除后，也可能造成文件结构不合理，需要重新组织文件。
堆文件：如果数据库中的一个基本表的数据量很少，并且插入、删除、更新等操作非常频繁，该基本表可以采用堆文件组织形式。因为堆文件无需建立索引，维护代价非常低。虽然堆文件的数据访问效率较低，但在数据量很少时，定位文件记录的时间非常短。
顺序文件：文件信息存放在若干连续的物理块中。其优点是简单，支持顺序存取和随机存取，顺序存取速度相对较快。缺点是文件不能动态增长，不利于文件插入和删除。如果用户的查询条件定义在查找码上，则顺序文件是比较适合的文件结构。
聚集文件：将不同关系表中有关联关系的记录存储在一起。
如果某些重要而频繁的用户查询经常需要进行多表连接操作，可以考虑聚集文件，来改善查询效率。

运行管理与维护阶段包括日常维护、监控与分析、性能优化调整、系统进化。

数据库的 反规范化是为了减少 表间的连接，提高 查询性能， 但并非所有经反规范的数据库都是高效的，这与实际的应用有关，只有满足一定条件的数据库采用反规范方法才能提高性能。

在 "确定型连接联系"中，如果 子女实体集中的每个实例都是由它与 双亲的联系而确定，那么这个联系就被称为 "标定型联系"。在标定型联系中子女实体集总是从属实体集，标定型联系用一条实线或者线段把他们连接起来，1
(父)端是线段的原点，n (子女)端是线段的终点，并用一个实心圆点表示其联系的基数是n。

如果两个实体集之间发生联系，其中一个实体类型的标识符进入另一个实体类型并与该实体类型中的标识符共同组成其标识符时，这种联系则称为标定联系。一个多对多分解为两个一对多时，其联系为标定型联系。

常见能提高连接操作性能或者减少连接操作的是:
增加冗余列:指在多个表中增加具有相同语义的列，它常用来在查询时避免连接操作;
反规范化:也就是降低表的规范化程度，减少表间的连接，提高查询性能;
对于经常需要进行查询、连接、统计操作，且数据量大的基本表可以建立索引提高查询效率;
聚集文件可以提高频繁进行多表连接操作的查询效率。

在 IDEF1X数据建模方法中， 直角矩形框用于表示 独立实体集， 圆角矩形框用于表示 从属实体集。

IDEF1X侧重分析、抽象和概括应用领域中的数据需求，被称为 数据建模方法。

IDEF 1X 是IDEF系列方法中IDEF1的扩展版本，是在E-R(实体联系)方法的原则基础上，增加了一些规则，使语义更为丰富的一种方法。
概念模型 设计常用IDEF1X方法。
IDEF1X建模方法: 实体集(独立实体集、从属实体集) 、 联系(标定型联系、非标定型联系、分类联系、非确定联系) 。从属实体集可以有自己的主码，并不是只能参与标定型联系。

事务概要设计 内容包括:事务 名称 、事务所访问的 关系表及关系属性 、事务 处理 逻辑、事务 用户 (指使用、启动、调用该事务的软件模块或系统)。

ORDER BY 语句用于对结果集进行排序 :
①ORDER BY语句用于根据指定的列对结果集进行排序;
②ORDER BY语句默认按照升序对记录进行排序。ORDER BY可以对多个列进行排序，此时的排序是嵌套的; ORDER BY语句只能作为其他子句之后的最后一个子句出现;视图中也可以使用ORDER BY语句;子查询语句中是不能使用ORDER BY子句的。