目录
数据:
是数据库中存储的基本对象,是描述事物的符号记录。
数据库(DB):
存放数据的仓库。
数据库管理系统(DBMS):
是一个专门用于实现对数据进行管理和维护的系统软件。
数据库系统(DBS):
是指在计算机中引入数据库后的系统,一般由数据库(DB)、数据库管理系统(DBMS)、应用程序、数据库管理员(DBA)组成。
数据管理技术发展的三个阶段:
人工管理、文件管理、数据库管理。
数据库的三级模式结构:
内模式:数据的物理存储方式。
外模式:用户所看到的视图数据。
模式:数据的逻辑组织方式。
数据模型三要素:
静态特征:数据的基本结构、数据的约束条件
动态特征:定义在数据上的操作
E-R模型:
主要涉及三个方面内容:实体、属性、联系。
码:
在实体属性中,将能够唯一标识实体的一个属性或最小的一组属性称为实体的表示属性,也称为实体的码。
联系的分类:
一对一、一对多、多对多
关系模型的三要素:
关系模型的数据结构、关系模型的操作集合、关系模型的完整性约束
关系数据库:
就是二维表的集合或者说是关系的集合。
关系:
就是二维表,二维表的名字就是关系的名字。
属性:
二维表的每个列称为一个属性。
值域:
二维表中属性的取值范围称为值域。
元组:
二维表中的一行数据称为一个元组。
分量:
元组中的每一个属性值称为元组的一个分量。
关系模式:
关系模式就是二维表的表框架结构或表头结构。
候选键:
能够唯一标识一个关系的元组而又不包含多于属性的一个属性或属性集。一个关系上有多个候选键。
主键:
表中的属性或属性组,用于唯一地确定一个元组。一个关系上只有一个主键。
主属性、非主属性:
包含在任一候选键中的属性称为主属性。
不包含在任一候选键中的属性称为非主属性。
关系代数:
关系数据库的三个完整性:
实体完整性、参照完整性、用户定义完整性
SQL查询处理的四个阶段:
查询分析、查询检查、查询优化、查询执行
查询树:
叶节点:代表查询的基本输入关系。
非叶节点:代表在关系代数表达式中应用操作的中间关系。
根节点:代表查询结果。
SQL server的存储体系结构中的 页、区:
页大小为8KB,每页开头是96Kb的页首。
一个区由8个物理上连续的页组成。区分为两种类型:统一区、混合区。
常见的文件逻辑结构:
顺序文件、索引文件、索引顺序文件
文件的逻辑结构按形式分为:有结构的记录式文件、无结构的流式文件。
常见的文件物理结构:
顺序结构、链接结构、索引结构
数据元素的表示(数据项、记录、文件):
数据项即为字段或属性,数据项是最基本的数据元素。
若干相关的数据项的组合称为记录。
若干记录的集合或若干磁盘块的集合形成一个文件。
索引的分类:
聚集索引、非聚集索引
DBMS对数据库的安全与保护通过四个方面实现:
数据的安全性控制、数据的完整性控制、数据库的并发控制、数据库的恢复
数据库的完整性:
正确性、有效性、相容性
事务:
事务是一系列的数据库操作,是数据库应用程序的基本逻辑单元。
事务处理技术主要包括并发控制技术和数据库恢复技术。
事务的基本性质(ACID):
原子性、一致性、隔离性、持久性
事务调度分类:
串行调度、并行调度
并发操作带来的问题:
- 丢失修改(写 - 写错误)
- 脏读(写 - 读错误)
- 不可重复读(读 - 写错误)
- 幻象读
产生原因:并发操作破坏了事务的隔离性。
锁:
排他锁(X锁)、共享锁(S锁)
恢复技术的实现:
转储、日志
转储:分全量转储(每次转储数据库的全部数据)、增量转储(每次只转储上一次转储后更新的数据)
日志是以事务为单位记录数据库中的每一次更新活动的文件,由系统自动记录。
函数依赖:
在一个表或关系里面,属性X可以映射到属性Y,称X函数决定Y,或Y函数依赖X。
第一范式(1NF):
不包含非原子项属性的关系是第一范式的关系。
第二范式(2NF):
满足第一范式,且属性集中的每一个非主属性都完全函数依赖于主键。
第三范式(3NF):
满足第二范式,且所有的非主属性都不传递依赖于主键。
关系模式分解的规范化:
- 分解具有无损连接性
- 分解能够保持函数依赖
数据库设计的主要步骤:
需求分析、概念模型设计、逻辑模型设计、物理模型设计
数据流图:
数据流图是从数据传递和加工角度,以图形方式来表达系统的逻辑功能、数据在系统内部的逻辑流向和逻辑变换过程,是结构化系统分析方法的主要表达工具。
数据字典:
数据字典是对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明。在数据库应用系统设计中,需求分析得到的数据字典是最原始的数据字典,以后在概念设计和逻辑设计中的数据字典都由它依次变换和修改而得到。
聚集:
聚集定义某类型的组成成分,将对象类型的组成成分抽象为实体的属性。