📑对应
本文对应教材《数据库系统原理与设计(第3版)》,清华大学出版社
第一章 数据库系统概论
数据管理技术的产生与发展
-
人工管理阶段
人工管理的数据是面向应用程序的。
-
文件系统阶段
文件系统阶段已经有了操作系统,有专门的软件对数据进行统一管理。
-
数据库管理系统阶段
数据库管理阶段有数据库管理系统(DBMS),数据库管理系统是由一个相互关联的数据的集合(称为数据库)和一组用以访问、管理和控制这些数据的程序组成。
数据模型
分层
- 概念模型(信息模型)
- 逻辑模型
- 物理模型
组成要素
- 数据结构
- 数据操作
- 数据完整性约束
实现
-
层次模型
-
网状模型
-
关系模型
数据抽象
数据库三级模式
-
外模式(子模式,用户模式)
对应于视图层数据抽象
-
模式(逻辑模式)
对应于逻辑层数据抽象
-
内模式(存储模式)
对应于物理层数据抽象
数据库的两层映像
- 外模式/模式映像
- 模式/内模式映像
数据库三级模式和三层模型的关系
- 三级模式是DBMS的体系结构
- 三层模型是数据库设计的工具和方法(要满足DBMS体系结构的要求)
数据库系统
数据库系统(database system, DBS),是指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统(及其应用开发工具)、应用系统、数据库管理员和最终用户构成
**数据库管理系统(DBMS)**是一组软件,负责数据库的访问、管理和控制。
常常把数据库系统简称为数据库,数据库管理系统简称为数据库系统
数据库管理系统(DBMS)的功能
- 数据定义,提供数据定义语言(DDL)
- 数据组织、存储和管理
- 数据操纵,提供数据操纵语言(DML)
- 数据库的事务管理和运行管理
- 数据库的建立和维护
- 其他功能
第二章 关系模型与关系代数
关系数据结构
关系模型的数据结构就是二维表,亦称为关系 。
关系数据库是表的集合,即关系的集合。
表是一个实体集,一行就是一个实体,它由有关联的若干属性的值所构成。
域(domain)
是一组具有相同数据类型的值的集合。
笛卡尔积(cartesian product)
给定一组域 D 1 , D 2 , … , D n D_1, D_2, …, D_n D1,D2,…,Dn,它们之中可以有相同的域。
D 1 , D 2 , … , D n D_1, D_2, …, D_n D1,D2,…,Dn的笛卡尔积为:
D 1 × D 2 × … × D n = { ( d 1 , d 2 , … , d n ) ∣ d i ∈ D i , i = 1 , 2 , … , n } D_1×D_2× …×D_n = \{(d_1, d_2, …, d_n)∣d_i∈Di, i=1, 2, …, n\} D1×D2×…×Dn={(d1,d2,…,dn)∣di∈Di,i=1,2,…,n}
集合中的每一个元素 ( d 1 , d 2 , … , d n ) (d_1, d_2, …, d_n) (d1,d2,…,dn)称为一个n元组, 简称为元组
元素中的每一个值 d i d_i di称为一个分量。
关系(relation)
D 1 × D 2 × … × D n D_1×D_2× …×D_n D1×D2×…×Dn的有限子集称为在域 D 1 , D 2 , … , D n D_1, D_2, …, D_n D1,D2,…,Dn上的关系
$r(D_1, D_2, …, D_n) $
n是关系的目或度(degree),代表关系是n元关系
- 关系也是一个二维表
- 表的每行 对应于关系的 一个元组
- 表的每列 对应于关系的 一个域
- 表的列的名字叫做属性(attribute)
关系的要求
关系中的每个属性的域必须是原子的,即域中的每个值都是不可再分的
关系中的每个元组都是可区分的,即存在唯一标识不同元组的属性(集)——码。
关系模式(relation schema)
表头部分对应于关系模式, 是型
表体部分对应于关系,是元组的集合,是值
r(U, D, DOM, F)
r(U)
r ( A 1 , A 2 , … , A n ) r(A_1, A_2, …, A_n) r(A1,A2,…,An)
- r为关系名
- U为属性名的集合${A_1, A_2, …, A_n} $
- D为属性集U中所有属性所来自的域的集合
- DOM为属性向域的映像集合
- F为属性间数据的依赖关系集合
码(key)
超码 (superkey)
对于关系r的一个或多个属性的集合A,如果属性集A可以唯一地标识关系r中的一个元组,则称属性集A为关系r的一个超码。
即能唯一标识元组的属性集
候选码(candidate key)
如果属性集A是关系r的超码,且属性集A的任意真子集都不能成为关系r的超码,则称属性集A为候选码 。
即不能再小的超码
在数据库建模中,当一实体集存在多个候选码时,主码选择原则:
- 选择属性长度最短的候选码
- 选择包含单个属性的码,而不是复合候选码
- 选择在数据库系统生命周期内属性值最少变化的候选码
- 选择在数据库系统生命周期内更可能包含唯一值的候选码
主码(primary key)
若一个关系有多个候选码,则可以选定其中的一个候选码作为该关系的主码 。
即只能挑一个候选码当主码用于标识
外码(foreign key)
设F是关系r的一个属性(或属性集), K s K_s Ks是关系s的主码。如果F与 K s K_s Ks相对应(即关系r中属性F的取值范围对应于关系s中主码 K s K_s Ks的取值范围的子集),则称F是关系r参照关系s的外码。
即某个关系的一个属性是另一个关系(可以是相同的关系)的主码(取值范围可以不一样)
外码的值要么为null,要么为参照的主码的值
部分码(partial key)
在数据库建模中,一个弱实体集中用来标识弱实体的属性(集)
弱实体由标识实体集中的主码与其部分码共同标识。
关系数据库模式
关系数据库模式,即关系模式的集合(对应表头的集合),是型
关系数据库实例,即关系的集合(对应表体的集合),是值
关系完整性约束
实体完整性:主码不能取空值null,若主码是属性集,那每一个属性元素都不能取空值null
参照完整性:外码要么每一个元组对应取值都为空值null,要么等于对应的主码
关系代数
对于关系r和关系s
差
r − s = { t ∣ t ∈ r ∧ t r-s = \{ t∣t∈r∧t r−s={t∣t∈r∧t