范式NF
设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不 同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。
目前关系数据库有5+1级范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式 (BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。
满足最低要求的范式是第一范式(1NF)。在第 一范式的基础上进一步满足更多规范要求的称为第二范式(2NF),其余范式以次类推。如果不满足所要求 的范式,则将不满足范式要求的部分进行分表。一般说来,数据库只需满足第三范式(3NF)就行了。
NF1
所有列不可分,字段满足原子性
定义学生,学生(编号、班级编号、姓名、亲属),这个亲属列是可分的,所以将亲属列划分到另外表中, 从而使剩余的列满足NF1,最终结构选择为 学生(编号、班级编号、姓名)、学生亲属(姓名、关系、外码)
NF2
消除对主键的部分依赖
定义学生,学生(编号、班级编号、姓名、宿舍楼号),主键为复合主键(编号、班级编号),这里会发现一 旦班级编号确定则所属的系别就确定,系别确定则宿舍楼号确定。宿舍楼号部分依赖主键,不是依赖整 个主键。解决问题的方法为分表 学生(编号、班级编号、姓名) 学生住宿 (班级编号、宿舍楼号)
NF3
消除对主键的传递依赖
定义学生,学生(学号pk、系别、宿舍楼号),主键为学号,所以自然满足NF2,但是一旦系别确定则 宿舍楼号确定,所以宿舍楼号依赖于系别,不是依赖于学号。这里就是传递依赖:宿舍楼号-->系别-->学 号pk。解决问题的方法为分表
范式和反范式
应用范式可以减少数据冗余,但是范式级别越高,则创建表的数量越多,查询效率则越低。所以在具体 开发中经常采用降低范式要求,采用合理冗余数据的方式以提高查询效率
考虑查询效率,所以一般只达到NF3即可,甚至有时会了提高查询效率会有意降低范式要求【反范式】
经典案例:电商网站,例如京东和淘宝
商品(商品编号(pk)、商品类别)-->商品(商品编号pk,类别编号)、类目(类目标号、类目名称)
商品的数量非常庞大,而且类别要分为3个级别 10*10*10
实际应用:商品(编号、1级类别名称、2级类别名称、3级类别名称)