第二章 关系数据库
关系数据库简介
1、提出关系模型的是美国IBM公司的E.F.Codd
- 1970年提出关系数据模型 E.F.Codd, “A Relational Model of Data for Large Shared Data Banks”, 《Communication of the ACM》,1970
- 之后,提出了关系代数和关系演算的概念
- 1972年提出了关系的第一、第二、第三范式
- 1974年提出了关系的BC范式
(好吧这张图没啥用,好像就是讲讲计算机的历史,我没看懂,如果懂了评论下,让我也学学)
2.1 关系数据结构及形式化定义
2.1.1 关系
1、单一的数据结构----关系
- 现实世界的实体以及实体间的各种联系均用关系来表示
2、逻辑结构----二维表
- 从用户角度,关系模型中数据的逻辑结构是一张二维表
3、建立在集合代数的基础上
域
1、域是一组具有相同数据类型的值的集合。例:
- 整数
- 实数
- 介于某个取值范围的整数
- 长度指定长度的字符串集合
- {‘男’,‘女’}
- ………………
笛卡尔积(Cartesian Product)
1、笛卡尔积 - 给定一组域D1,D2,…,Dn,允许其中某些域是相同的。D1,D2,…,Dn的笛卡尔积为:D1×D2×…×Dn ={(d1,d2,…,dn)|di属于Di,i = 1,2,…,n}
- 所有域的所有取值的一个组合
- 不能重复
2、元组(Tuple)
- 笛卡尔积中每一个元素(d1,d2,…,dn)叫作一个n元组(n-tuple)或简称元组(Tuple)
- (张清玫,计算机专业,李勇)、(张清玫,计算机专业,刘晨)等都是元组
3、分量(Component)
- 笛卡尔积元素(d1,d2,…,dn)中的每一个值di叫作一个分量
- 张清玫、计算机专业、李勇、刘晨等都是分量
给出3个域
D1=导师(SUPERVISOR)集合 {张清玫,刘逸}
D2=专业(SPECIALITY)集合{计算机专业,信息专业}
D3=研究生(POSTGRADUATE)集合 {李勇,刘晨,王敏}
笛卡尔积的基数为2×2×3=12
关系
- 关系
- D1×D2×…×Dn的子集叫作在域D1,D2,…,Dn上的关系,表示为 R(D1,D2,…,Dn)
- R:关系名
- n:关系的目或度(Degree)
- 关系是笛卡尔积的子集
- 元组
- 关系中的每个元素是关系中的元组,通常用t表示。
- 单元关系与二元关系
- 当n=1时,称该关系为单元关系(Unary relation)或一元关系
- 当n=2时,称该关系为二元关系(Binary relation)
- 关系的表示
- 关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域
5)属性 - 关系中不同列可以对应相同的域
- 为了加以区分,必须对每列起一个名字,称为属性(Attribute)
- n目关系必有n个属性
- 码
候选码(Candidate key)
- 若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码
- 简单的情况:候选码只包含一个属性
全码(All-key)
- 最极端的情况:关系模式的所有属性组是这个关系模式的候选码,称为全码(All-key)
主码
- 若一个关系有多个候选码,则选定其中一个为主码(Primary key)
主属性
- 候选码的诸属性称为主属性(Prime attribute)
- 不包含在任何侯选码中的属性称为非主属性( Non-Prime attribute) 或非码属性(Non-key attribute)
- 三类关系
- 基本关系(基本表或基表):实际存在的表,是实际存储数据的逻辑表示
- 查询表:查询结果对应的表
- 视图表:由基本表或其它视图表导出的表,是虚表,不对应实际存储的数据
笛卡尔积不满足交换律
关系作为笛卡尔积的子集需做如下限定
- 关系必须是有限集合
- 通过为每个列附加属性名从而取消关系元组的有序性,即关系的列属性满足交换律
8)基本关系的性质
(1)列是同质的(Homogeneous)
(2)不同的列可出自同一个域
- 其中的每一列称为一个属性
- 不同的属性要给予不同的属性名
(3) 列的顺序无所谓,,列的次序可以任意交换
(4) 任意两个元组的候选码不能相同
(5)行的顺序无所谓,行的次序可以任意交换
(6) 分量必须取原子值
2.1.2 关系模式
1、什么是关系模式
- 关系模式(Relation Schema)是型
- 关系是值
- 关系模式是对关系的描述
(1)元组集合的结构:属性构成 属性来自的域 属性与域之间的映象关系
(2)元组语义(n目谓词)以及完整性约束条件
(3)属性间的数据依赖关系集合
2、定义关系模式
关系模式可以形式化地表示为:
R(U,D,DOM,F)
R 关系名
U 组成该关系的属性名集合
D 属性组U中属性所来自的域
DOM 属性向域的映象集合
F 属性间的数据依赖关系集合
3、关系模式与关系
-
关系模式
(1)对关系的描述
(2)静态的、稳定的 -
关系
(1)关系模式在某一时刻的状态或内容
(2) 动态的、随时间不断变化的 -
关系模式和关系往往统称为关系
通过上下文加以区别
2.1.3 关系数据库
1、关系数据库
- 在一个给定的应用领域中,所有关系的集合构成一个关系数据库
2、关系数据库的型与值
- 关系数据库的型: 关系数据库模式,是对关系数据库的描述
- 关系数据库的值: 关系模式在某一时刻对应的关系的集合,通常称为关系数据库
3、关系数据库的型: 关系数据库模式, 对关系数据库的描述
4、关系数据库模式包括
(1)若干域的定义
(2)在这些域上定义的若干关系模式
5、关系数据库的值: 关系模式在某一时刻对应的关系的集合,简称为关系数据库
3.1.4 关系模型的存储结构
1、关系数据库的物理组织
- 有的关系数据库管理系统中一个表对应一个操作系统文件,将物理数据组织交给操作系统完成
- 有的关系数据库管理系统从操作系统那里申请若干个大的文件,自己划分文件空间,组织表、索引等存储结构,并进行存储管理
2.2 关系操作
2.2.1 基本关系操作
1、常用的关系操作
- 查询:选择、投影、连接、除、并、交、差、笛卡尔积
(1)查询的表达能力是其中最主要的部分
(2)选择、投影、并、差、笛卡尔基是5种基本操作 - 数据更新:插入、删除、修改
2、关系操作的特点
- 集合操作方式:操作的对象和结果都是集合,一次一集合的方式
2.2.2 关系数据库语言的分类
1、关系代数语言
- 用对关系的运算来表达查询要求
- 代表:ISBL
2、关系演算语言:用谓词来表达查询要求
- 元组关系演算语言
(1)谓词变元的基本对象是元组变量
(2)代表:APLHA, QUEL - 域关系演算语言
(1)谓词变元的基本对象是域变量
(2)代表:QBE - 具有关系代数和关系演算双重特点的语言
代表:SQL(Structured Query Language)
2.3 关系的完整性
关系的三类完整性约束
1、实体完整性和参照完整性:
- 关系模型必须满足的完整性约束条件, 称为关系的两个不变性,应该由关系系统自动支持
2、用户定义的完整性: - 应用领域需要遵循的约束条件,体现了具体领域中的语义约束
2.3.1 实体完整性
2.3.2 参照完整性
- 关系R和S可以是相同也可以是不同的两个关系
- 目标关系S的主码Ks 和参照关系的外码F必须定义在同一个(或一组)域上
- 外码并不一定要与相应的主码同名
- 当外码与相应的主码属于不同关系时,往往取相同的名字,以便于识别
2.3.3 用户定义的完整性
- 针对某一具体关系数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求
- 关系模型应提供定义和检验这类完整性的机制,以便用统一的系统的方法处理它们,而不要由应用程序承担这一功能