关系数据库
关系数据结构及形式化定义
- 关系
- 单一的数据结构—关系:现实世界的实体以及实体间的各种联系均用关系来表示
- 逻辑结构—二维表:从用户角度,关系模型中数据的逻辑结构是一张二维表
- 建立在集合代数上
- 域
- 是一组具有相同数据类型的值得集合
- 笛卡尔积
- 给定一组域 d1,d2,。。。,dn,允许其中某些域是相同的。其笛卡尔积为每个域的乘积。
- 所有域的所有取值的一个组合
- 不能重复
- 基数:若di(i=1,2,3….n)为有限集,其基数为mi(i=1.2.3…n)则D1*D2*……Dn的基数M为:M=所有m的乘积
- 表示方法:
- 笛卡尔积可以表示为一张二维表
- 表中的每行对应一个元组,表中的每列对应一个域
- 例如,给出3个域:
- D1=导师集合SUPERVISOR={张清玫,刘逸}
- D2=专业集合SPECIALITY={计算机专业,信息专业}
- D3=研究生集合POSTGRADUATE={李勇,刘晨,王敏}
- D1,D2,D3的笛卡尔积为
- D1×D2×D3={
- (张清玫,计算机专业,李勇),(张清玫,计算机专业,刘晨),
- (张清玫,计算机专业,王敏),(张清玫,信息专业,李勇),
- (张清玫,信息专业,刘晨),(张清玫,信息专业,王敏),
- (刘逸,计算机专业,李勇),(刘逸,计算机专业,刘晨),
- (刘逸,计算机专业,王敏),(刘逸,信息专业,李勇),
- (刘逸,信息专业,刘晨),(刘逸,信息专业,王敏) }
- 基数为2×2×3=12
- 给定一组域 d1,d2,。。。,dn,允许其中某些域是相同的。其笛卡尔积为每个域的乘积。
-
- 关系
- 关系
- 关系
D1*D2*D3*……Dn的子集叫做在域D1,D2……Dn上的关系,表示
R(D1,D2,…,Dn)
-
-
- R:关系名
- n:关系的目或度(Degree)
-
-
-
- 元组:关系中的每个元素是关系中的元组,通常用t表示。
- 单元关系与二元关系
-
当n=1时,该关系为单元关系或一元关系
当n=2时,该关系为二元关
-
-
- 关系的表示:
- 关系也是一个二维表,表的每一行对应一个元组,表的每一列对应一个域
- 属性
- 关系中不同列也可以对应相同的额域
- 为了加以区分,必须对每一列起一个名字,称为属性
- N目关系必有n个属性
- 码
- 候选码:若关系中的某一组属性组的值能唯一的标识一个元组,则成该属性为候选码
- 简单的情况:候选码只包含一个属性
- 全码:最极端的情况:关系模式的所有属性组是这个关系模式的候选码,则称为全码
- 主码:若一个关系有多个候选码,则定期中一个为主码
- 主属性:候选码的诸属性为主属性,不包含在任何候选码中属性称为非主属性或非码属性
- 码
- 主码:如果一个关系有多个候选码,则选取其中一个为主码
- 主属性:候选码的诸属性称为主属性,不包含在任何候选码中的属性称为非主属性或者非码属性
- 三类关系
- 基本关秀:基本存在表,是实际存储数据的逻辑结构
- 查询表:查询结构对应表
- 视图表:由基本表或其他视图导出的表,是虚标,不对应实际存储的数据
- 基本关系的性质
- 列本是同质的
- 不同的列可以出同一个域
- 其中的每一列称为一个属性
- 不同的属性要给予不同属性名
- 列的顺序无所谓,,列的次序可以任意改变
- 任意的顺序无所谓,列的次序可以 任意交换
- 任意两个元组的候选码不能相容
- 行的顺序无所谓,行的次序可以任意交换
- 关系的表示:
-
- 关系模式
- 什么是关系模式
- 关系模式是型
- 关系是值
- 关系模式是 对关系的描述
- 元组集合的结构
- 属性构成
- 属性来自的域
- 属性与域之间的映像关系
- 完整性约束条件
- 元组集合的结构
- 定义关系模式:可表示为R(U,D,DOM,F)R:关系名,U:组成改关系的属性名集合。D:U中属性属性所来自的域,DOM:属性向域的映像集合,F属性间数据的依赖关系的集合
- 关系模式与关系
- 关系模式
- 对关系的描述
- 静态的,稳定的
- 关系
- 关系模式在某一时刻的状态或内容
- 动态的,随时间不断变化的
- 关系模式和关系往往统称为关系:通过上下文区别
- 关系模式
- 什么是关系模式
- 关系数据库
- 关系数据库
- 在一个给定的应用领域中,所有关系的集合构成一个关系数据库
- 关系数据库 的型与值
- 型:关系数据库模式,是对关系数据库的描述
- 值:关系模式在某一时刻对应的关系的集合,通常称为关系数据库
- 关系数据库
- 关系模式的存储结构
- 关系数据库的物理组织
- 有的关系数据库管理系统中的一个表对应一个操作系统文件,将物理数据组织交给操作系统完成
- 有的关系数据库管理系统从操作系统哪里申请若干个大的文件,自己花分文件空间,组织表,索引等存储结构,并进行存储管理
- 关系数据库的物理组织
关系操作
-
-
-
- 常见的关系操作
- 查询操作:选择,投影,链接,除,并,差,交,笛卡尔积
- 选择,投影,并,差,笛卡尔积
- 数据更新:插入,删除,修改
- 查询操作:选择,投影,链接,除,并,差,交,笛卡尔积
- 关系模式的特点
- 集合操作方式:操作的对象和结果都是集合,一次一集合的方式
- 关系代数语言
- 用对关系的运算来达到表达查询要求
- 代表:ISBL
- 关系演算语言:用谓词来表达查询要求
- 元组关系演算语言
- 谓词变元的基本对象是元组变量
- 代表:APLHA,QUEL
- 域关系演算语言
- 谓词变元的基本操作是域变量
- 代表:QBE
- 元组关系演算语言
- 具有关系代数和关系演算双重特点的语言
- 代表:SQL
- 常见的关系操作
-
-
关系的完整性
- 实体完整性和参照完整性
- 关系模型必须满足的完整性约束条件称为关系的两个不变性,应该由关系系统自动支持
- 用户定义的完整性
- 应用领域需要的约束条件,体现了具体领域中的语义约束
实体完整性:
- 若数据A是基本关系R的主属性,则A不能取空值
- 空值就是 不存在 或 无意义的值
- 例:
- 选修(学号,课程号,成绩)
- “学号、课程号”为主码
- “学号”和“课程号”两个属性都不能取空值
- 实体完整性的说明
- 实体完整性规则是针对基本关系而言的,一个基本表通常对应现实世界的一个实体集。
- 现实世界中的实体是可以区分的,即他们具有某种唯一标识。
- 关系模型中的实体是可以区分的,即他们具有某种唯一性标识。
- 主码中的属性即主属性不能取空值,主属性取空值,说明存在不可区分的实体,与第二点冲突,因此这个规则称为实体完整性。
参照完整性
- 关系间的引用
- 在关系模型中实体及实体间 的联系都是用关系来描述的,自然存在着关系与关系的引用
- 外码
- 设F是基本关系R的一个或一组属性,但不是关系R的码。如果F与基本关系S的主码Ks相对应,则称F是R的外码。
- 基本关系R称为参照关系
- 基本关系S称为被参照关系或目标关系
- 关系R和S不一定是不同的关系
- 目标关系S的主码Ks和参照关系的外码F必须定义在同一个域上
- 外码并不一定要与相应的主码同名
- 参照完整性规则
- 若属性F是基本关系R的外码它与基本关系S的主码相对应,则对于每个元组F上的值必须为:
- 或者取空值
- 或者等于S\中的额某个元祖的主码值
- 若属性F是基本关系R的外码它与基本关系S的主码相对应,则对于每个元组F上的值必须为:
用户定义的完整性
- 针对某一具体关系数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求
- 关系模型应提供定义和检验者类完整性的机制,以便用同一的系统的方式处理他们,而不需由应用程序承担着一功能。
关系代数
- 关系代数式一种抽象的查询语言,它用对关系的运算来表达查询
- 关系代数
- 运算对象是关系
- 运算关系亦为关系
- 关系代数的运算符有两种:集合运算符和专门的关系运算符
- 传统的集合运算是从运算的“水平”方向即行的角度进行
- 专门的关系运算不仅涉及行而且涉及列
|
| |
|
|
|
|
| |
|
| |
|
| |
|
|
|
|
| |
| ||
|
|
传统的集合运算
- 并
- R和S
- 具有相同的目n
- 相应的属性取自同一个域
- RuS
- 仍未n目关系,由属于R或S的元组组成:R∪S = { t|t Î R∨t ÎS }
- R和S
- 差
- R和S
- 具有相同的目n
- 相应的属性取自同一域
- R-S
- 仍为n目关系,由属于R而不属于S的所有元组组成R -S = { t|tÎR∧tÏS }
- R和S
- 交
- R和S
- 具有相同的目
- 相应 的属性取自同一个域
- R∩S
- 仍为n目关系,由即属于R由属于S的元组组成R∩S = { t|t Î R∧t ÎS }
- R∩S = R –(R-S)
- R和S
- 笛卡儿积
- 严格地讲应该是广义的笛卡儿积
- R:n目关系,K1个元组
- S:m目关系,K2个元组
- R*S
- 列(n+m)列元组的集合
- 元组的前n列是关系的R的一个元组
- 后m列是关系的S的一个元组
- 行:K1*K2个元组
- R×S = {tr ts |tr ÎR ∧ tsÎS }
- 列(n+m)列元组的集合
专门的关系运算
- 1) R,tÎR,t[Ai]
设关系模式为R(A1,A2,…,An)
它的一个关系设为R
- ÎR表示t是R的一个元组
t[Ai]则表示元组t中相应于属性Ai的一个分量
(2) A,t[A], A
若A={Ai1,Ai2,…,Aik},其中Ai1,Ai2,…,Aik是A1,A2,…,An中的一部分,则A称为属性列或属性组。
t[A]=(t[Ai1],t[Ai2],…,t[Aik])表示元组t在属性列A上诸分量的集合。
A则表示{A1,A2,…,An}中去掉{Ai1,Ai2,…,Aik}后剩余的属性组。
(3) tr ts
R为n目关系,S为m目关系。
- r ÎR,tsÎS, tr ts称为元组的连接。
tr ts是一个n + m列的元组,前n个分量为R中的一个n元组,后m个分量为S中的一个m元组。
(4)象集Zx
给定一个关系R(X,Z),X和Z为属性组。
当t[X]=x时,x在R中的象集(Images Set)为:
- x={t[Z]|t ÎR,t[X]=x}
它表示R中属性组X上值为x的诸元组在Z上分量的集合
专门的关系运算
-
-
- 选择
-
- 选择又称为限制
- 选择运算的含义
- 在关系R中选择满足给定条件的诸元组σF(R) = {t|tÎR∧F(t)= '真'}
- F:选择条件,是一个逻辑表达式,取值为真或假
- 基本形式为:X1θY1
- θ表示比较运算符,它可以是>,≥,<,≤,=或<>
- 选择运算是从关系R中选取使逻辑表达式F为真的元组,是从行的角度进行的运算。
-
- 投影
- 从R中选择出若干属性列组成新的关系
- 投影造作主要是从列的角度进行运算
- 投影之后不仅取消了原关系中的某些列,而且还可能取消某些元组(避免重复行)
- 选择
-
-
-
-
- 链接
- 链接也称θ链接
- 链接运算的含义
- 从两个关系中的笛卡尔积中选取属性间满足一定条件的元组
- A和B:分别为R和S上度数相等且可比的属性组
- Θ:比较运算符
- 链接运算从R和S的广义笛卡尔积R*S中选取R关系在A属性组上的值与S关系在B上上的值满足比较关系0的元组
- 两类常用的连接运算
- 等值连接
- Θ为“=”的连接运算称为等值连接
- 从关系R与S的广义笛卡尔积中选取AB属性值相等的那些元组,即等值连接为:R S = { | tr ÎR∧ts ÎS∧tr[A] = ts[B] }
- 自然连接
- 自然连接是一种特殊的等值连接
- 两个关系中进行比较的分量必须是相同的属性组
- 在结果中吧相同那个的属性列去掉
- 自然连接的含义:R和S具有相同的属性组B: R S = { [U-B] | tr ÎR∧ts ÎS∧tr[B] = ts[B] }
- 悬浮元组
- 两个关系R和S在做自然连接时,关系R中某些元组有可能在R中这些元组时被舍弃了这些被舍弃的被元组成为悬浮元组
- 外连接
- 如果把悬浮元组也保存在关系中,而在其他属性上填空值,就叫外连接
- 左外连接
- 之保留左边关系R中的悬浮元组
- 右外连接
- 只保留右边关系S中的悬浮元组
- 自然连接是一种特殊的等值连接
- 等值连接
- 除运算
- 给定关系R(X,Y)和S(Y,Z),其中X,Y,Z为属性组。R中的Y和S中的Y可以有不同的属性名,但必须出自相同的域集。
- R和S的除运算得到一个新的关系P(X)
- P是R中满足下列条件的元组在X属性列上的投影:
- 元组 在X上分量值X的像极Yx包含S在Y上投影的集合,记做:R÷S={tr[X]|trÎR∧πY(S)ÍYx}
- Yx:x在R中的象集,x = tr[X]
- 小结
- 关系代数运算
- 并交叉笛卡儿积,投影,选择,连接,除
- 基本运算
- 并交叉笛卡儿积 投影 选择
- 交 连接 除
- 可以用5中基本运算来表达
- 引进他们并不增加语言比表达能力,但可以简化表达
- 5种基本运算:
- 并交差 笛卡儿积 投影 选择,不能用其他运算来表达
- 3中简化运算
- 交 连接 和 除
- 关系代数运算
-
-
- 1.交:R∩S=R-(R-S)
- 2.连接:R S=sXqY(R×S)
- 3.除法:R÷S=PX(R)-PX(PX(R)×S-R)
可见,引进他们并没有增加语言的表大能力,但可以大大简化表达式
集合运算实现的数据库操作
- 数据记录的添加和插入
- 数据记录的删除:关系差运算
- 数据记录的修改操作:先删除后插入——关系差运算+关系并运算
- 关系的连接:关系的笛卡儿积