参考文章:https://www.cnblogs.com/1906859953Lucas/p/8299959.html
数据库范式是指:
为了建立冗余较少,结构合理的数据库,在数据库设计中需要遵循一些规范,在关系型数据库中就称这些规范为范式。
开发中最常见的设计范式有三种:
1. 第一范式:
当关系模式R的所有属性都不能在分解为更基本的数据单位时,称R是满足第一范式的,简记为1NF。
即:每一列属性都不可再分,确保每一列属性的原子性。
例如:地址列 可以分为省、市,地区等等若干列。
2. 第二范式:
如果关系模式R满足第一范式,并且R得所有非主属性都完全依赖于R的每一个候选关键属性,称R满足第二范式,简记为2NF。
即:确保数据库表中每一列都和主键有关,而不能只和主键的一部分相关(针对联合主键)
例如要设计一个订单表,因为订单中可能会有多种商品,多以要将订单编号和商品编号作为表的联合主键,如下图:
上述表中商品属性只与商品编号相关,但是与订单编号无关,不符合第二范式的规定。所以根据第二范式,需要将商品信息提取为一张表,将订单内容提取为另一张表。如下:
这样设计很大程度上减少了数据的冗余,让数据存储更为合理。
3. 第三范式:
设R是一个满足第一范式条件的关系模式,X是R的任意属性集,如果X非传递依赖于R的任意一个候选关键字,称R满足第三范式,简记为3NF。
即:确保表中每个属性都和主键直接关联,而不是间接关联。
例如:Student表(学号,姓名,年龄,性别,所在院校,院校地址,院校电话),学号为主键。
上述结构中,院校地址和院校电话与院校直接关联,但是与学号存在传递依赖的关系。依赖关系:学号--> 所在院校 --> (院校地址,院校电话),不符合第三范式的规定。
所以应该将上述表分为两个,使之符合第三范式。
Student表(学号,姓名,年龄,性别,院校),School表(院校,院校地址,院校电话)。
4. 小结:
三大范式只是一般设计数据库的基本理念,可以建立冗余较小、结构合理的数据库。当有特殊情况时,需要根据实际情况进行适当修改。数据库设计最看重的是需求跟性能,需求>性能>表结构。不能一味得去追求范式建立数据库。