【吐血整理】数据库的规范化

本文主讲数据库的 规范化理论,欢迎阅读~


前言

逻辑设计(即表结构的设计)
针对具体问题,构造数据模式
工具:关系数据库的规范化理论
(总结起来就是:规范化理论就是数据库中用来设计表的工具)

关系模式由五部分组成,是一个五元组:R(U, D, DOM, F)

R 是符号化的元组语义(即表名)
U 为一组属性(即属性列的集合)
D 为属性组U中的属性所来自的域
DOM 为属性到域的映射
F 为属性组U上的一组数据依赖

ps:D、DOM与模式设计关系不大,只用到三元组:R<U,F>

满足二维表每个分量必须是不可分开的数据项条件(即该表内不含有更小的表)的关系模式就属于:第一范式(1NF)
(ps:范式,Normal Form)
— — — — — — — — — — — — — — — — — —
数据依赖
是一个关系内部属性与属性之间(即列与列之间)的一种约束关系

· 通过属性间值的相等与否体现出来的数据间相互联系
· 是现实世界属性间相互联系的抽象
· 是数据内在的性质
· 是语义的体现

主要类型:

  • 函数依赖(Functional Dependency,简记为FD)
  • 多值依赖(Multi-Valued Dependency,简记为MVD)

函数依赖普遍存在于现实生活中:例如描述一个学生关系,可以有学号、姓名、系名等属性。

一个学号只对应一个学生,一个学生只在一个系中学习
“学号”确定后,学生姓名及所在系的值就被唯一确定。

Sname=f(Sno),Sdept=f(Sno)
读作:Sno函数决定Sname,Sno函数决定Sdept
记作:Sno→Sname,Sno→Sdept
— — — — — — — — — — — — — — — — — —
🌟来看个例子: 现建立一个描述学校教务的数据库。涉及的对象包括: 学号(Sno),所在系(Sdept),系主任姓名(Mname),课程号(Cno),成绩(Grade)。假设学校教务的数据库模式用一个单一的关系模式Student来表示,则该关系模式的属性集合为:
U = {Sno, Sdept, Mname, Cno, Grade}
现实世界的已知事实(语义,即理论基础):

一个系有若干学生, 但一个学生只属于一个系;
一个系只有一名(正职)负责人;
一个学生可以选修多门课程,每门课程有若干学生选修;
每个学生学习每一门课程有一个成绩。

由此可得到属性组U上的一组函数依赖F: F={Sno→Sdept, Sdept→Mname, (Sno, Cno)→Grade}
此时关系模式Student(Sno, Sdept, Mname, Cno, Grade)中存在的问题有:
1)数据冗余:浪费大量的存储空间,每一个系主任的姓名重复出现
2)更新异常(Update Anomalies):更新数据时,维护代价大:某系更换系主任后,须修改有关的每一个元组
3)插入异常(Insertion Anomalies):如果一个系刚成立,尚无学生,则无法把这个系及其系主任存入数据库
4)删除异常(Deletion Anomalies):如果某个系的学生全部毕业了, 则在删除该系学生信息的同时,把这个系及其系主任的信息也丢掉了

👀总结起来Student关系模式不是一个好的模式。一个“好”的模式应当不会发生插入异常、删除异常和更新异常,数据冗余应尽可能少。
分析:这些问题是由存在于模式中的某些数据依赖引起的。重点来了,可以用规范化理论改造关系模式来消除其中不合适的数据依赖
把这个单一的模式成三个关系模式(即拆成三个表):

S(Sno,Sdept,Sno → Sdept);
SC(Sno,Cno,Grade,(Sno,Cno) → Grade);
DEPT(Sdept,Mname,Sdept → Mname);

现在这三个模式都不会发生插入异常、删除异常的问题,数据的冗余也得到了控制👌
好了,引入部分结束啦,下面开始详细地进行讲解~


一、函数依赖

1. 函数依赖

设R(U)是一个属性集U上的关系模式,X和Y是U的子集
若对于R(U)的任意一个可能的关系r,r 中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等 (有点绕口,,可理解为两个元组在X上的属性值相等,则在Y上的属性值也一定相等
则称“X函数确定Y”或“Y函数依赖于X”,记作X→Y
🌟看例子加深理解: Student(Sno, Sname, Ssex, Sage, Sdept), 假设不允许重名,则有:
(附上Student表)
在这里插入图片描述
(ps:若X→Y,并且Y→X, 则记为X←→Y。若Y不函数依赖于X, 则记为X ↛ \not\rightarrow Y。)
Sno → Ssex,Sno → Sage,Sno → Sdept,
Sno ←→ Sname
Sname → Ssex,Sname → Sage,Sname → Sdept
但Ssex ↛ \not\rightarrow Sage, Ssex ↛ \not\rightarrow Sdept

2. 平凡函数依赖与非平凡函数依赖

X→Y,但Y⊈X则称X→Y是非平凡的函数依赖
X→Y,但Y⊆X 则称X→Y是平凡的函数依赖
即,X能函数确定Y,若Y是X的子集,则为平凡函数依赖,若Y不是X的子集则为非平凡的函数依赖。根据刚刚的定义来理解,两个元组在X上的属性值相等,那么它的子集里这两个元组的属性值也必定是相等的吖,所以平凡函数依赖都是必然成立的,我们一般讨论的是非平凡函数依赖。

👀平凡函数依赖都是必然成立的,不反映新的语义。
若不特别声明, 我们总是讨论非平凡函数依赖
— — — — — — — — — — — — — — — — — —
若X→Y,则X称为这个函数依赖的决定因素
若X→Y,Y→X,则记作X←→Y。
若Y不函数依赖于X,则记作X ↛ \not\rightarrow

  • 73
    点赞
  • 237
    收藏
    觉得还不错? 一键收藏
  • 15
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值