设计关系数据库时,遵从不同的范式要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,要遵循后边的范式要求,必须先遵循前边所有范式要求。各种范式呈递次规范,越高的范式数据库冗余越小。目前关系数据库有六种范式:第一范式1NF、第二范式2NF、第三范式3NF、巴斯-科德范式BCNF、第四范式4NF、第五范式5NF(5NF又称完美范式)。
1NF:每一列都是不可分割的原子数据项,不能是集合、数组等非原子数据项。即表中的某个列有多个值时,必须拆分为不同的列。
2NF:在1NF的基础上,非码属性必须完全依赖于码(在1NF基础上消除非主属性对主码的部分函数依赖)。特点:一张表只描述一件事情,表中的每一列都完全依赖于主键。
示例:
学生证号 | 学生证名称 | 学生证办理时间 | 借书证 | 借书证名称 | 借书证办理时间 |
分成两个表:
学生证号 | 学生证名称 | 学生证办理时间 |
借书证 | 借书证名称 | 借书证办理时间 |
3NF:在2NF基础上,任何非主属性不依赖于其他非主属性(在2NF基础上消除传递依赖)。
示例:
学号 | 姓名 | 年龄 | 所在学院 | 学院地点 |
存在传递的决定关系:学号--->所在学院--->学院地点
分成:
学号 | 姓名 | 年龄 | 所在学院的编号(外键) |
学院编号 | 所在学院 | 学院地点 |
总结:
1NF:原子性,每列不可再拆分
2NF:不产生局部依赖,一张表只描述一件事情
3NF:不产生传递依赖,表中每一列都直接依赖于主键。而不是通过其他列间接依赖于主键。
几个概念:
函数依赖:A-->B,如果通过A属性(组)的值,可以确定唯一B属性的值,则称为B依赖于A
完全函数依赖:A-->B,如果A是一个属性组,则B属性值的确定需要依赖于A属性组中所有的属性值。
部分函数依赖:A-->B,如果A是一个属性组,则B属性值的确定只需要依赖于A属性组中某一些值即可。
传递函数依赖:A-->B,B-->C,如果通过A属性(组)的值,可以确定唯一B属性的值,再通过B属性(组)的值可以确定唯一C属性的值,则称C传递函数依赖于A。
码:如果在一张表中,一个属性或属性组,被其他所有属性所完全依赖,则称这个属性(组)为该表的码。
主属性:码属性组中的所有属性
非主属性:除过码属性组的属性