数据库设计的范式
概念
- 设计数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。
- 要遵循后边的范式要求,必须先遵循前边的所有范式要求
- 目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)、第五范式(5NF,又称完美范式)
学习
第一范式(1NF):每一列都是不可分割的原子数据项
- 问题1:存在非常严重的数据冗余(重复),姓名、系名、系主任
- 问题2:数据添加存在问题,添加新开设的系和系主任时,数据不合法
- 问题3:数据删除存在问题,张无忌同学毕业了,删除数据,会将系的数据一起删除
- 1NF
学号 | 姓名 | 系名 | 系主任 | 课程名称 | 分数 |
---|---|---|---|---|---|
10010 | 张无忌 | 经济系 | 张三丰 | 高等数学 | 95 |
10010 | 张无忌 | 经济系 | 张三丰 | 大学英语 | 87 |
10010 | 张无忌 | 经济系 | 张三丰 | 计算机基础 | 65 |
10011 | 令狐冲 | 法律系 | 任我行 | 法理学 | 77 |
10011 | 令狐冲 | 法律系 | 任我行 | 大学英语 | 87 |
10011 | 令狐冲 | 法律系 | 任我行 | 法律社会学 | 65 |
10012 | 杨过 | 法律系 | 任我行 | 法律社会学 | 95 |
10012 | 杨过 | 法律系 | 任我行 | 法理学 | 97 |
10012 | 杨过 | 法律系 | 任我行 | 大学英语 | 99 |
第二范式(2NF):在1NF的基础上,非码属性必须完全依赖于候选码(在1NF基础上消除非主属性对主码的部分函数依赖)
-
函数依赖:A–>B
如果通过A属性(属性组)的值,可以确定唯一的B属性的值,则称B依赖于A
例如:学号–>姓名。(学号,课程名)–>分数 属性组(学号,课程名)
-
完全函数依赖:A–>B
如果A是一个属性组,则B属性值的确定需要依赖于A属性组中所有的属性值
例如:(学号,课程名)–>分数
-
部分函数依赖:A–>B
如果A是一个属性组,则B属性值的确定只需要依赖于A属性组中的某一些值即可。
例如:(学号,课程名)–>姓名
-
传递函数依赖:A–>B,B–>C
如果通过A属性(属性组)的值,可以确定唯一B属性的值,再通过B属性(属性组)的值可以确定唯一C属性的值,则称C传递函数依赖于A。
例如:学号–>系名,系名–>系主任
-
码
如果在一张表中,一个属性或属性组,被其它所有属性所完全依赖,则称这个属性(属性组)为该表的码。
例如:在上表中,码是一个属性组,(学号,课程名)
主属性:码属性组中的所有属性
非主属性:除码属性的其它属性
-
消除部分函数依赖:拆分表
-
2NF:将1NF拆分
学号 | 课程名称 | 分数 |
---|---|---|
10010 | 高等数学 | 95 |
10010 | 大学英语 | 87 |
10010 | 计算机基础 | 65 |
10011 | 法理学 | 77 |
10011 | 大学英语 | 87 |
10011 | 法律社会学 | 65 |
10012 | 法律社会学 | 95 |
10012 | 法理学 | 97 |
10012 | 大学英语 | 99 |
学号 | 姓名 | 系名 | 系主任 |
---|---|---|---|
10010 | 张无忌 | 经济系 | 张三丰 |
10011 | 令狐冲 | 法律系 | 任我行 |
10012 | 杨过 | 法律系 | 任我行 |
第三范式(3NF):在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
- 3NF:将2NF再次拆分
学号 | 课程名称 | 分数 |
---|---|---|
10010 | 高等数学 | 95 |
10010 | 大学英语 | 87 |
10010 | 计算机基础 | 65 |
10011 | 法理学 | 77 |
10011 | 大学英语 | 87 |
10011 | 法律社会学 | 65 |
10012 | 法律社会学 | 95 |
10012 | 法理学 | 97 |
10012 | 大学英语 | 99 |
学号 | 姓名 | 系名 |
---|---|---|
10010 | 张无忌 | 经济系 |
10011 | 令狐冲 | 法律系 |
10012 | 杨过 | 法律系 |
系名 | 系主任 |
---|---|
经济系 | 张三丰 |
法律系 | 任我行 |