Data Management Technology(4) -- 关系数据库理论

规范化问题的提出

在规范化理论出现以前,层次和网状数据库的设计只是遵循其模型本身固有的原则,而无具体的理论依据可言,因而带有盲目性,可能在以后的运行和使用中发生许多预想不到的问题。

在关系数据库系统中,关系模型包括一组关系模式,各个关系不是完全孤立的,数据库的设计较层次和网状模型更为重要。

如何设计一个适合的关系数据库系统,关键是关系数据库模式的设计,一个好的关系数据库模式应该包括多少关系模式,而每一个关系模式又应该包括哪些属性,又如何将这些相互关联的关系模式组建一个适合的关系模型,这些工作决定了整个系统运行的效率,也是系统成败的关键所在,所以必须在关系数据库的规范化理论的指导下逐步完成。

要求设计教学管理数据库,其关系模式SCD如下:

SCD(SNO,SN,AGE,DEPT,MN,CNO,SCORE)

其中,SNO表示学生学号,SN表示学生姓名,AGE表示学生年龄,DEPT表示学生所在的系别,MN表示系主任姓名,CNO表示课程号,SCORE表示成绩。

根据实际情况,这些数据有如下语义规定:

  1. 一个系有若干个学生,但一个学生只属于一个系;
  2. 一个系只有一名系主任,但一个系主任可以同时兼几个系的系主任;
  3. 一个学生可以选修多门功课,每门课程可有若干学生选修;
  4. 每个学生学习课程有一个成绩。

在此关系模式中填入一部分具体的数据,则可得到SCD关系模式的实例,即一个教学管理数据库,如下图所示。

根据上述的语义规定,并分析以上关系中的数据,我们可以看出:(SNO,CNO)属性的组合能唯一标识一个元组,所以(SNO,CNO)是该关系模式的主键(思考:没有主键行不行?) 。

但在进行数据库的操作时,会出现以下几方面的问题。

  1. 数据冗余。

    每个系名和系主任的名字存储的次数等于该系的学生人数乘以每个学生选修的课程门数,同时学生的姓名、年龄也都要重复存储多次,数据的冗余度很大,浪费了存储空间。(思考:如果不重复记录学生非主属性,会出现什么情况?)

  2. 插入异常。

    如果某个新系没有招生,尚无学生时,则系名和系主任的信息无法插入到数据库中。

    因为在这个关系模式中,(SNO,CNO)是主键。根据关系的实体完整性约束,主键的值不能为空,而这时没有学生,SNO和CNO均无值,因此不能进行插入操作。

    另外,当某个学生尚未选课,即CNO未知,实体完整性约束还规定,主键的值不能部分为空,同样不能进行插入操作。

  3. 删除异常。

    某系学生全部毕业而没有招生时,删除全部学生的记录则系名、系主任也随之删除,而这个系依然存在,在数据库中却无法找到该系的信息。

    另外,如果某个学生不再选修C1课程,本应该只删去C1,但C1是主关系键的一部分,为保证实体完整性,必须将整个元组一起删掉,这样,有关该学生的其它信息也随之丢失。

  4. 更新异常。

    如果学生改名,则该学生的所有记录都要逐一修改SN;

    又如某系更换系主任,则属于该系的学生记录都要修改MN的内容,稍有不慎,就有可能漏改某些记录,这就会造成数据的不一致性,破坏了数据的完整性。

由于存在以上问题,我们说,SCD是一个不好的关系模式。产生上述问题的原因,直观地说,是因为关系中“包罗万象”,内容太杂了。

在SCD中,既存在完全函数依赖,又存在部分函数依赖和传递函数依赖。这种情况往往在数据库中是不允许的,也正是由于关系中存在着复杂的函数依赖,才导致数据操作中出现了种弊端。克服这些弊端的方法是用投影运算将关系分解,去掉过于复杂的函数依赖关系,向更高一级的范式进行转换。

好的关系模式:

把关系模式SCD分解为下面三个结构简单的关系模式,如下图所示。

学生关系S(SNO,SN,AGE,DEPT)

选课关系SC(SNO,CNO,SCORE)

系关系D(DEPT,MN)

在以上三个关系模式中,实现了信息的某种程度的分离,

  • S中存储学生基本信息,与所选课程及系主任无关;
  • D中存储系的有关信息,与学生无关;
  • SC中存储学生选课的信息,而与学生及系的有关信息无关。

与SCD相比,分解为三个关系模式后,数据的冗余度明显降低。

  • 当新插入一个系时,只要在关系D中添加一条记录。
  • 当某个学生尚未选课,只要在关系S中添加一条学生记录,而与选课关系无关,这就避免了插入异常。
  • 当一个系的学生全部毕业时,只需在S中删除该系的全部学生记录,而关系D中有关该系的信息仍然保留,从而不会引起删除异-常。
  • 同时,由于数据冗余度的降低,数据没有重复存储,也不会引起更新异常。

从而得出结论,一个好的关系模式应该具备以下四个条件:

  1. 尽可能少的数据冗余。
  2. 没有插入异常。
  3. 没有删除异常。
  4. 没有更新异常。

主要内容

函数信赖

范式(Normal Form)

模式设计

函数信赖起着核心的作用,是模式分解和模式设计的基础,范式是模式分解的标准。

函数依赖

关系模式中的各属性之间相互依赖、相互制约的联系称为数据依赖。数据依赖一般分为函数依赖、多值依赖和连接依赖。其中,函数依赖是最重要的数据依赖。

函数依赖(Functional Dependency)是关系模式中属性之间的一种逻辑依赖关系。

例如关系模式SCD中,SNO与SN、AGE、DEPT之间都有一种依赖关系。由于一个SNO只对应一个学生,而一个学生只能属于一个系,所以当SNO的值确定之后,SN,AGE,DEPT的值也随之被唯一的确定了。这类似于变量之间的单值函数关系。设单值函数Y=F(X),自变量X的值可以决定一个唯一的函数值Y。在这里,我们说SNO决定函数(SN,AGE,DEPT),或者说(SN,AGE,DEPT)函数依赖于SNO。

函数依赖的定义

设关系模式R(U,F),U是属性全集,F是U上的函数依赖集,X和Y是U的子集,如果对于R(U)的任意一个可能的关系r,对于X的每一个具体值,Y都有唯一的具体值与之对应,则称X决定函数Y,或Y函数依赖于X,记作X→Y。我们称X为决定因素,Y为依赖因素。当Y不函数依赖于X时,记作:X-/->Y。当X→Y且Y→X时,则记作:X<–>Y。

对于关系模式SCD

U={SNO,SN,AGE,DEPT,MN,CNO,SCORE}

很显然:SNO→SN,SNO→AGE,SNO→DEPT

一个SNO有多个SCORE的值与其对应,因此SCORE不能唯一地确定,即SCORE不能函数依赖于SNO,所以有: SNO-/->SCORE。但是SCORE可以被(SNO,CNO)唯一地

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值