二. 关系数据库
关系数据库简介
IBM公司 1970 提出关系数据库模型
2.1 关系数据结构
-
单一的数据结构–关系
现实世界的实体以及实体间的各种联系均用关系来表示
2.1.1 域(Domain)和关系
1. 域(Domain)
-
定义:域是一组具有相同数据类型的值的集合
-
笛卡尔积
给定一组域D1,D2,D3…Dn ,允许其中某些域是相同的
D1,D2,D3…Dn 的笛卡尔积为:
D1D2D3…Dn ={(d1,d2,d3…dn)|di属于Di,i=1,2,3,4、、、n}
- 所有域的所有取值的任意组合
- 笛卡尔积可以看作是关系的“域”
-
基数:
-
笛卡尔积的表示方法
- 笛卡尔积可表示为一张二维表
- 表中的每行对应一个元组,表中的每列对应一个域
2. 关系
-
定义:D1D2D3…Dn的子集叫做域D1,D2,D3…Dn 上的关系,表示为
R(D1,D2,D3…Dn )
- R:关系名
- n:关系的目或度(Degree)
-
元组:关系中的每个元素(d1,d2,d3…dn)叫做一个n 元组或者简称元组,通常用t表示
-
属性:
- 关系中不同列可以对应相同的域
- 为了加以区分,必须给每列起一个名字,称为属性(Attribute)
- n目关系必有n个属性
-
码
-
候选码:
若关系中的某一属性值能唯一标识一个元组,则称该属性组为候选码
简单的情况:候选码只包含一个属性
-
全码:
最极端的情况:关系模式中所有属性组是这个关系模式的候选码,称为全码
-
主码:
若一个关系有多个候选码,则选定其中一个为主码
-
主属性:
候选码的诸属性称为主属性
不包含在任何候选码中的属性称为非主属性或非码属性
-
-
单元关系与二元关系
- 当n=1时,称该关系为单元关系或者 一元关系
- 当n=2 时,称该关系为二元关系
-
基本关系的性质
-
列时同质的;
-
不同的列可以出自同一个域;
-
列的顺序无所谓,列的次序可以任意调换;
-
任意两个元组的候选码不能相同;
-
行的顺序无所谓,行的次序可以任意调换;
-
分量必须取原子值。
这是规范条件中最基本的一条,即元素不可再分
-
-
笛卡尔积的某个子集才有实际意义,全集没有实际意义。
2.1.2 关系模式
1. 什么是关系模式
-
关系模式是型
-
关系是值
-
关系模式是对关系的描述
-
元组集合的结构
-
属性构成
-
属性来自的域
-
属性与域之间的映像关系
-
-
完整性约束条件
-
2. 如何定义关系模式
-
关系模式可以形象化的表示为:
R(U,D,DOM,F)
R 关系名 U 组成该关系的属性名集合 D U中属性来自的域 DOM 属性向域的映像集合 F 属性间数据的一来关系的集合 关系模式通常简记为
R(U) 或者 R(A1,A2,A3…An)
- R:关系名
- A1,A2,A3…An:属性名
域名及属性向域的映像通常直接说明为属性的类型、长度
3. 关系模式与关系的关系
-
关系模式:型
- 对关系的描述
- 静态的,稳定的
-
关系:值
- 关系模式在任意时刻的状态或内容
- 动态的,随时间不断变化的
-
关系模式和关系往往笼统的称为关系
通过上下文进行区分
2.1.3 关系数据库
-
关系数据库
在一个给定的应用领域中,所有关系的集合构成了一个关系数据库
-
关系数据库的型与值
- 关系数据库的型:关系数据库模式,是对关系数据库的描述
- 关系数据库的值:关系模式子啊某一时刻对应的关系的集合。通常称为关系数据库
2.2 关系完整性约束
关系的三类完整性约束
- 实体完整性和参照完整性
关系模式必须满足的完整性约束条件称为关系的两个不变性,应该由关系系统自当支持
- 用户定义的完整性
应用领域需要遵循的约束条件,体现了具体领域中的语义约束
2.2.1.实体完整性
- 实体完整性:
- 关系的主属性不能取空值
- 空值就是不知道或者不存在或无意义的值
2.2.2.参照完整性
-
关系间的引用
- 在关系模型中实体及实体间的联系通常都是用关系来描述的,自然存在这关系和关系间的引用
-
外码
- 设F 是基本关系R的一个或一组属性,但不是关系R的码,如果F与基本关系S的主码 Ks相对应,则称F 是R 的外码
- 基本关系R 称为参照关系
- 基本关系S 称为被参照关系或目标关系
-
参照完整性规则
- 若属性(或属性组)F是基本关系R 的外码,它与基本关系 S 的主码 Ks 相对应(基本关系R和S不一定的是不同的关系,也就是说可以是一个关系),则对于 R 中每个元组在 F 上的值必须为:
- 或者取空值(F 的每个属性值均为空值)因为它在参照关系(目标关系)中不一定是主码
- 或则等于 S (被参照关系)中的某个元组的主码值
- 若属性(或属性组)F是基本关系R 的外码,它与基本关系 S 的主码 Ks 相对应(基本关系R和S不一定的是不同的关系,也就是说可以是一个关系),则对于 R 中每个元组在 F 上的值必须为:
2.2.3 用户定义的完整性
- 针对某一具体关系数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求
- 关系模型应提供定义和检测这类完整性的机制,以便统一的系统的方法来处理他们,而不需由应用程序来承担这一功能
2.3 关系代数
关系代数是一种抽象的查询语言,它对关系的运算来表达查询
关系代数
- 运算对象是关系
- 运算结果亦为关系
- 关系代数的运算符有两类:集合运算符和专门的关系运算符
2.3.1 传统的集合运算
一些记号
R | 关系 |
---|---|
t属于R | t是R的一个元组 |
t[Ai] | 表示元组t中相应于属性Ai的一个分量 |
-
并
-
R 和 S
- 具有相同的目n(即两个关系都有n个属性)
- 相应的属性取自同一个域
-
结果
- 结果仍为n目关系,由属于 R 或属于 S 的元组组成
- 自动去重
-
-
差
-
R 和 S
- 具有相同的目n
- 相应的属性取自同一个域
-
R-S
- 仍为n 目关系,由属于R但不属于 S 的所有元组组成
-
-
交
- R 和 S
- 具有相同的目n
- 相应的属性取自同一个域
- 结果
- 仍为n 目关系,由即属于R 又属于 S 的元组组成
- R 和 S
-
笛卡尔积
2.3.2 专门的关系运算
1. 选择
- 选择又称限制
- 选择符号的含义
- 选择运算是从关系R中选取是逻辑表达式F 为真的元组,是从行的角度进行的运算
2. 投影
- 从R 中选择出若干属性列组成新的关系
- 投影操作主要从列的角度进行运算
- 投影之后不仅取消了原关系中的某些列,而且还可能取消某些元组(避免重复行)
3. 连接
-
从俩个关系的笛卡尔积中选取属性间满足一定条件的元组
-
两类常用连接
- 等值连接
- 自然连接:是一种特殊的等值连接
- 两关系中进行比较的分量必须是相同的属性
- 在结果中把重复的属性去掉
- 悬浮元组:两个关系在做自然连接时,被舍弃的元组
-
一般的操作连接是从行的角度进行计算
自然连接还需要取消重复列,所有同时从行和列的角度进行运算
-
外连接
-
如果把悬浮元组也保存在结果关系中,而在其他属性上填空值,就叫做外连接
-
左外连接
- 只保留左边关系R中的悬浮元组
-
右外连接
- 只保留右边关系S中的悬浮元组
-
4. 除运算
- 除操作是同时在行和列角度进行计算