数据库杂谈(四)——关系演算和E-R数据模型

3 形式化关系查询语言

3.2 关系演算和E-R数据模型

3.2.1 概述

除了用关系代数表示关系操作外,还可以用谓词演算来表达关系的操作,这称为关系演算

关系代数表示关系的操作,须标明关系操作的次序,哪个操作先哪个后你要说清楚,所以以关系代数为基础的数据库语言是过程化查询语言。用关系演算表示关系的操作,只要说明所要得到关系的结果,而不必标明操作的过程,因而他是非过程的。关系演算分为元组关系演算域关系演算

3.2.2 元组关系演算

3.2.2.1 概述

元组关系演算就是以元组为变量,一般形式是 t [ < 属 性 表 > ] ∣ P ( t ) {t[<属性表>]|P(t)} t[<>]P(t)

一般形式描述了其为使谓词P为真的元组t的集合。当我们选的不是元组,而是元组的部分属性的时候,就可以采用属性表。

利用关系演算是可以做关系代数的所有操作的。举一个例子,如果我们要查询江苏籍贯的女大学生姓名,那么我们会这么写:
t [ 姓 名 ] ∣ t ∈ S T U D E N T A N D t . 性 别 = ′ 女 ′ a n d t . 籍 贯 = ′ 江 苏 ′ {t[姓名]|t∈STUDENT AND t.性别 = '女' and t.籍贯 = '江苏'} t[]tSTUDENTANDt.=andt.=
但是对于上面的查询,我们只是表达了要查找的元组是在所表达的条件之中。为了表达要查询的请求,我们需要引入数理逻辑的“存在”这一结构。记法为: ∃ t ∈ r ( Q ( t ) ) \exist t∈r(Q(t)) tr(Q(t))。这样的意思是表示关系r中存在元组t使谓词Q(t)为真。并且,我们在考试中很少写and和or,而是改用 ⋀ 和 ⋁ \bigwedge和\bigvee 来代替。

用上面的表达来表示上面的例子,即为: t [ 姓 名 ] ∣ ∃ t ∈ S T U D E N T ⋀ t . 性 别 = ′ 女 ′ ⋀ t . 籍 贯 = ′ 江 苏 ′ {t[姓名]|\exist t∈STUDENT \bigwedge t.性别 = '女' \bigwedge t.籍贯 = '江苏'} t[]tSTUDENTt.=t.=

那如果我们想表示学生表里不是江苏籍贯的女大学生的姓名呢?这只需要用 ┐ \urcorner ,即否定符号,如下: t [ 姓 名 ] ∣ ¬ ∃ t ∈ S T U D E N T ⋀ t . 性 别 = ′ 女 ′ ⋀ t . 籍 贯 = ′ 江 苏 ′ {t[姓名]|¬ \exist t∈STUDENT \bigwedge t.性别 = '女' \bigwedge t.籍贯 = '江苏'} t[]¬tSTUDENTt.=t.=

如果我们要表达那些是江苏所有的大学生呢?我们会发现,这里面含有一个所有的概念,为了用元组关系演算书写此查询,我们引入了 ∀ \forall

在上面的叙述中我们发现,我们基本都是把高中课本上面的谓词全部搬上来关系演算使用。

3.2.2.2 形式化定义

结果上一小节的叙述,我们知道元组关系演算表达式具有如下形式: t ∣ P ( t ) {t | P(t)} tP(t)。其中P是一个公式,公式中可以出现多个元组变量。对于没有被量词绑定的变量,我们称为自由变量。如果被量词绑定了,我们称为受限变量

对于元组关系演算的公式,其由原子组成,原子可以是如下的形式之一:

  • 如果是s∈r,那么代表s是元组变量r是关系。这是需要注意的是我们不允许使用 ∉ ∉ /
  • 对于s[x]op[y],那么其中op为<,>,=,<=,>=,!=当中任意一个。
3.2.2.3 表达式的安全性

元组关系演算与关系代数具有同等表达能力,也是关系完备的。用谓词演算表示关系操作时,只有结果是有限集才有意义。也就是说,一个表达式的结果如果是有限的,我们叫做表达式是安全的。反之,我们说他是不安全的。例如 { t ∣ t ¬ ∈ S T U D E N T } \{t| t ¬ ∈STUDENT\} {tt¬STUDENT},宇宙中不属于学生的东西是无限的,这个表达式是不安全的

3.2.3 域关系演算

关系演算的另一种形式为域关系演算,使用从属性域中取值的域变量,而不使用一整个元组的值。

就是关系代数是SQL语言的基础一样,域关系演算是被广泛采用的QBE语言。

域关系演算一般以域为变量,其一般形式为: < x 1 , x 2 , … , x n > ∣ P ( x 1 , x 2 , … x ( n + m ) ) {<x1,x2,…,xn>|P(x1,x2,…x(n+m))} <x1,x2,,xn>P(x1,x2,x(n+m))

这样说我们可能有点费解。在下面,我们有完整的习题可供练习。

域关系演算也是完备的,实际上这个案例和选择操作很像。

3.2.4 关于关系演算的习题

对于1、3、5写出元组关系演算,对于2、4、6写出域关系演算。

image-20220130150227058 image-20220130150818174

image-20220202231246548

这里留给各位看官一个BUG,第5题由于我的技术可能写的不对,网上的答案也是错的。所以如果是错的可以给我来个答案,如果是对的给我个提醒哈哈。

3.2.5 对传统数据模型的评价

一般来说,我们把层次,网状和关系数据模型称为传统数据模型。对于传统数据模型来说有四个弱点:

  • 以记录为基础,不能很好地面向用户和应用

    比如衣服,有一个衣服的表,里面有个属性是衣服的袖口类型,但是在现实世界中有很多连袖口都没有的衣服,虽然有NULL可以作为填补,但是用NULL是迫不得已,并不是一种自然的表示。

  • 不能以自然的方式表示实体之间的联系。

    有些联系本来不是那种PCR关系,不是链表关系,但是我们还是要引入什么link,什么虚记录来表示这些关系,这些表示是很不自然的。

  • 语义贫乏。

    比如你定义了一个表,表里面有学生的性别、年龄、身高、体重,但是你却不知道他们本身代表什么意思,我可以说这是学生的医疗记录,也可以说这是入学信息报告。还有表与表直接的联系,由于没有标明联系,有时候用户还需要查帮助文档和一些文件才能了解。所以,由于语义不明,导致就算语义理解错了也要用户自己负责。

  • 数据类型太少,难以满足应用需要。

3.2.6 E-R数据模型

3.2.6.1 基本概念

E-R数据模型,也叫实体联系数据模型。其提出的目的如下:

  1. 企图建立一个统一的数据模型,以概括三种传统的数据模型;
  2. 作为三种传统数据模型互相转换的中间概念
  3. 作为超脱DBMS的一种概念数据模型,以比较自然的方式模拟现实世界。

在E-R数据模型中有三个概念我们需要先知道,分别是实体属性联系

实体

  • 概念:凡是可以被人互相区别的东西就叫实体。

  • 范例:飞机,春游,神,梦。

  • 注意:同类实体我们可以归为一类,称为实体集

  • 范例:用E代表学生的实体集,那么E = {e|e是学生}

属性

  • 概念:实体的特征叫实体的属性,属性取值的范围叫值集。值集的说法相当于关系数据模型里的属性域。

联系

  • 概念:实体之间(也包括和实体集)的各种关系我们称之为联系。

  • 范例:某个学生(实体)和课程(实体)之间有选课关系。学生(实体集)和课程之间的选课关系。人与人直接有领导关系,夫妻关系。

  • 表示方法:如果实体e1,实体e2之间有联系,我们用<e1,e2>来表示,扩展到n个实体,我们用<e1,e2…,en>来表示,当n>2的时候,我们称为多元联系。

联系集

概念:比如说夫妻是一种联系,那么具体的比如:<e1,e2>两个人就是这个联系的实例,生活中是夫妻的不止一对,所以多个实例我们用集合包括起来,称为联系集。

有时为了表明实体在联系中的作用,我们会这么表示,以夫妻为例:

< r 1 / e 1 , r 2 / e 2 , … , r n / e n > <r1/e1,r2/e2,…,rn/en> <r1/e1,r2/e2,rn/en>
其中r表示哪个是夫,哪个是妻。

说明:联系虽然用元组表示,但实体间的次序不是重要的,尤其标明作用后,他们的次序可以任意。

3.2.6.2 E-R图

用E-R数据模型对一个单位的模拟,称为一个单位的E-R数据模式。E-R数据模式可以用非常直观地E-R图来表示。

image-20211002153926103

其中矩形框代表实体,菱形代表联系,椭圆代表属性。

需要注意的是,上述的表示实际上是不完整的,但是在大学考试以及考研中只要求用上述表述即可。

其他表示:

  • 未分割的矩形代表联系集的属性
  • 虚线将联系集属性连接到联系集
  • 双线显示实体在联系集中的参与度
  • 双菱形表示弱实体集

image-20220203115430184

对于E-R图来说有两个约束:基数比约束参与度约束。它们两个合称联系约束

基数比约束

比如联系有1:1,1:N,N:1,M:N。我们把这个数量上实体间的约束称为基数比约束。基数比约束在数据库原书上也被称为映射基数

范例:一个员工只能在一个工作部门工作,这就是1:1。

参与度约束

比如这个银行卡账号你最多只能取钱5次,比如这门课最多容纳学生150人,这就是参与度约束。

表达方式:(min,max)

3.2.7 题型总结

3.2.7.1 如何画E-R图

步骤总结:

  1. 找出实体并用矩形表示
  2. 找出实体的属性用椭圆表示
  3. 找出实体间的关系,用菱形表示

image-20211230212433335

image-20211230220040718


3.2.7.2 E-R图转关系模式

步骤总结:

  1. 实体转换为一个关系模式

  2. 实体的属性就是关系的属性,实体的码就是关系的码

  3. 实体间联系的转换

    • 1:1联系:在任意一方加入对方的主码变为外码,并加入联系本身的属性。

    • 1:n联系:将1方的主键加入n方作为其外键,并同时将联系的属性也加入n方。

    • m:n联系:将联系本身本身转化为一个关系模式,联系双方的主码加入其中,并将联系的属性加入其中。

image-20211230212450984

image-20220202231534255

3.2.8 扩充E-R数据模型

扩充E-R数据模型我们通常称为EER,在EER引入以下的几个概念:弱实体、特殊化和普遍化、聚集、范畴。

弱实体(Weak entity)

弱实体实际上可以当成实体,可以当成属性,由数据库库设计者决定。

范例:比如一个职工,他的家属实体集可能有姓名,出生日期,和职工的关系这些属性,但是家属的姓名是可以重复的。什么意思呢,简而言之就是家属实体集中的表没有键(没有实体键),导致失去了辨认家属的能力了,所以一般来说弱实体可以不做实体,只当做拥有这个实体集的那个实体(所有者实体)的组合属性。

特殊化和普遍化(Specialization and Generalization)

范例:从普遍到特殊叫特殊化,在一些书上也叫做特化;如学生是普遍,划分为研究生高中生本科生是特殊,研究生还可以继续划分为学术型研究生和专业性研究生。反之叫普遍化,在一些书上叫做概化

聚集(Aggregation)

就是把实体集和联系看成新的一个实体集,新的实体集中的属性是原来实体集的属性和联系的属性的并。

image-20211007134053250

范畴(Category)

在模拟现实世界时,有时候要用到不同类型的实体组成的实体集。我们把这类实体集叫做范畴。

  • 范例:车主有可能是一个人,有可能是一个企业的单位。

  • 表达方式:T(E1,E2,E3,…,En)

  • 说明:其中里面的不同的实体集我们叫做超实体集,例如E1是超实体集。

  • 图例:圆圈∪代表并操作。

image-20211007134142274

这里有一点需要说明一下,我们前面说过特殊化,特殊化也就是一个子类对于父类的继承,并且继承了所有的属性,但是范畴不一样。拿这个例子来说,单位和人构成范畴,但是这个账户不是说既是单位又是人的,他的继承具有选择性,如果账户是单位的,则继承单位的属性,是个人的继承个人的属性,这叫选择性继承

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ArimaMisaki

如果知识有用请我喝杯咖啡

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值