关系数据库理论也称为关系的规范化理论,是数据库的理论基础,同时也是数据库设计的有力工具。
规范化,数据依赖的公理系统和模式的分解是本科阶段要了解的内容,而后两者在研究生学习阶段需要加深巩固,所以对这几方面的学习做一个总结。
1、关系模式 R 的基本函数依赖和主码
设有一个记录各个足球队队员每场比赛进球数的关系模式
R(队员编号,比赛场次,进球数,足球队名,队长名)如果规定,每个队员只能属于一个足球队,每个足球队只有一个队长。
首先每一个队员对应一个球队:队员编号→足球队名
然后每一个球队对应一个队长:足球队名→队长名
进球数肯定是统计的某一个场次的某一个球员的进球数,所以球员和比赛场次对应进球数:(队员编号,比赛场次)→进球数
关系模式R的基本函数依赖F如下:
F = { 队员编号→球队名,足球队名→队长名,(队员编号,比赛场次)→进球数 }
其主键为(队员编号,比赛场次)。
2、部分函数依赖:设X,Y是关系R的两个属性集合,存在X→Y,若X’是X的真子集,存在X’→Y,则称Y部分函数依赖于X。
R不是 2NF 因为球队名部分依赖于主键,可以分解为
R1={队员编号,足球队名,队长名}
R2={队员编号,比赛场次,进球数}
举例:通过AB能得出C,通过A也能得出C,通过B也能得出C,那么说C部分依赖于AB。
3、传递函数依赖:设X,Y,Z是关系R中互不相同的属性集合,存在X→Y(Y !→X),Y→Z,则称Z传递函数依赖于X。
R不是 3NF ,因为有传递依赖,可以分解为
R11={队员编号,足球队名},R12={足球队名,队长名}
将 R 分解为 R11,R12 后均为 3NF 的关系模式。
举例:通过A得到B,通过B得到C,但是C得不到B,B得不到A,那么成C传递依赖于A
4、完全函数依赖:设X,Y是关系R的两个属性集合,X’是X的真子集,存在X→Y,但对每一个X’都有X’!→Y,则称Y完全函数依赖于X。
举例:通过AB能得出C,但是AB单独得不出C,那么说C完全依赖于AB。
总结
1、规范化:大表拆成小表
2、第一范式(1NF):不能表中有表
3、第二范式(2NF):消除非主属性与码的部分依赖
4、第三范式(3NF):消除非主属性与码的传递依赖
5、BC范式(BCNF):消除了主属性与码的部分依赖和传递依赖,也就是所有属性与码直接不存在依赖关系了