好的数据库设计对数据的存储性能和后期的程序开发, 都会产生重要的影响。建立科学的, 规范的数据库就需要满足一些规则来优化数据的设计和存储,这些规则就称为范式。
目前关系数据库有六种范式: 第一范式( 1NF)、 第二范式( 2NF)、 第三范式( 3NF)、 巴斯-科德范式( BCNF) 、第四范式(4NF)和第五范式( 5NF,又称完美范式)。
满足最低要求的范式是第一范式( 1NF)。在第一范式的基础上进一步满足更多规范要求的称为第二范式( 2NF) ,其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。
1、1NF
数据库表的每一列都是不可分割的原子数据项, 不能是集合、 数组等非原子数据项。即表中的某个列有多个值时,必须拆分为不同的列。 简而言之,第一范式每一列不可再拆分,称为原子性。
例如:
学号 | 姓名 | 班级 |
1 | 张三 | 一年三班 |
2 | 李四 | 一年二级 |
3 | 王五 | 二年三班 |
2、2NF
在满足第一范式的前提下,表中的每一个字段都完全依赖于主键。
所谓完全依赖是指不能存在仅依赖主键一部分的列。 简而言之, 第二范式就是在第一范式的基础上所有列完全依赖于主键列。 当存在一个复合主键包含多个主键列的时候, 才会发生不符合第二范式的情况。比如有一个主键有两个列,不能存在这样的属性,它只依赖于其中一个列,这就是不符合第二范式。
第二范式的特点:
1) 一张表只描述一件事情;
2) 表中的每一列都完全依赖于主键。
例如:
借书证表
学生证号 | 学生证名称 | 学生证办理时间 | 借书证号 | 借书证名称 | 借书证办理时间 |
分成两种表
学生证号 | 学生证名称 | 学生证办理时间 |
借书证号 | 借书证名称 | 借书证办理时间 |
3、3NF
在满足第二范式的前提下,表中的每一列都直接依赖于主键,而不是通过其它的列来间接依赖于主键。
简而言之,第三范式就是所有列不依赖于其它非主键列,也就是在满足 2NF 的基础上, 任何非主列不得传递依赖于主键。 所谓传递依赖, 指的是如果存在"A → B → C"的决定关系, 则 C 传递依赖于 A。因此, 满足第三范式的数据库表应该不存在如下依赖关系:主键列 → 非主键列 x → 非主键列 y。
例如:
学生信息表
学号 | 姓名 | 年龄 | 所在学院 | 学院地点 |
存在传递的决定关系:学号---》所在学院---》学院地点
拆分成两张表
学号 | 姓名 | 年龄 | 所在学院的编号(外键) |
学院编号 | 所在学院 | 学院地点 |
4、三大范式小结
范式 | 特点 |
1NF | 原子性:表中每列不可再拆分。 |
2NF | 不产生局部依赖,一张表只描述一件事情 |
3NF | 不产生传递依赖,表中每一列都直接依赖于主键。而不是通过其它列间接依赖于主键。 |