概念:设计数据库时,需要遵循的一些规范。要遵循后边的范式要求,必须先遵循前边的所有范式要求
设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。
目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。
第一范式(1NF):每一列都是不可分割的原子数据项
(学号+课程):主属性
存在问题:主属性被姓名,性别,班级,班主任部分依赖(通过学号就能确定,数据冗余)
存在问题:班主任传递依赖与主属性(删除学生信息,班主任也被一并删除了,添加一个班必须添加学生)
学号 | 姓名 | 性别 | 班级 | 班主任 | 课程 | 分数 |
1001 | 小明 | 男 | 二班 | 王老师 | 数学 | 80 |
1001 | 小明 | 男 | 二班 | 王老师 | 语文 | 65 |
1001 | 小明 | 男 | 二班 | 王老师 | 英语 | 70 |
1002 | 小红 | 女 | 一班 | 韩老师 | 数学 | 76 |
1002 | 小红 | 女 | 一班 | 韩老师 | 语文 | 85 |
1002 | 小红 | 女 | 一班 | 韩老师 | 英语 | 70 |
1003 | 小强 | 男 | 三班 | 陈老师 | 数学 | 77 |
1003 | 小强 | 男 | 三班 | 陈老师 | 语文 | 82 |
1003 | 小强 | 男 | 三班 | 陈老师 | 英语 | 73 |
第二范式(2NF):在1NF的基础上,非码属性必须完全依赖于码(在1NF基础上消除非主属性对主属性的部分函数依赖)解决了数据冗余问题
(学号+课程):主属性
学号 | 课程 | 分数 |
1001 | 数学 | 80 |
1001 | 语文 | 65 |
1001 | 英语 | 70 |
1002 | 数学 | 76 |
1002 | 语文 | 85 |
1002 | 英语 | 70 |
1003 | 数学 | 77 |
1003 | 语文 | 82 |
1003 | 英语 | 73 |
(学号):主属性
存在问题:班主任传递依赖与主属性(删除学生信息,班主任也被一并删除了,添加一个班必须添加学生)
学号 | 姓名 | 性别 | 班级 | 班主任 |
1001 | 小明 | 男 | 二班 | 王老师 |
1002 | 小红 | 女 | 一班 | 韩老师 |
1003 | 小强 | 男 | 三班 | 陈老师 |
第三范式(3NF):在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)解决了,部分数据删除添加的问题
(学号+课程):主属性
学号 | 课程 | 分数 |
1001 | 数学 | 80 |
1001 | 语文 | 65 |
1001 | 英语 | 70 |
1002 | 数学 | 76 |
1002 | 语文 | 85 |
1002 | 英语 | 70 |
1003 | 数学 | 77 |
1003 | 语文 | 82 |
1003 | 英语 | 73 |
(学号):主属性
学号 | 姓名 | 性别 | 班级 |
1001 | 小明 | 男 | 二班 |
1002 | 小红 | 女 | 一班 |
1003 | 小强 | 男 | 三班 |
(班级):主属性
班级 | 班主任 |
二班 | 王老师 |
一班 | 韩老师 |
三班 | 陈老师 |