数据库设计三大范式的定义
第一范式
1、每一列属性都是不可再分的属性值,确保每一列的原子性
2、两列的属性相近或相似或一样,尽量合并属性一样的列,确保不产生冗余数据。
举例:一个表字段同时出现商品1和商品2两个的设计是不符合第一范式的
第二范式
每一行的数据只能与其中一列相关,即一行数据只做一件事。只要数据列中出现数据重复,就要把表拆分开来。
举例:一张订单表的出现商品信息和收货人地址,联系电话两个字段是不符合数据库第二范式的,因为收货人地址和电话会有重复,符合第二范式得做法使用地址id代替。
第三范式
数据不能存在传递关系,即每个属性都跟主键有直接关系而不是间接关系。
比如员工表(工号,姓名,年龄,性别,所在公司,公司地址,院校电话)
这样一个表结构,就存在上述关系。工号--> 所在公司 --> (公司地址,公司电话)这样的表结构,我们应该拆开来,如下。
(工号,姓名,年龄,性别,所在公司)--(所在公司,公司地址,公司电话)
数据库设计范式的优点:
因为数据减少了重复性,所以节省了存储空间和内存消耗,单表查询速度会更快。
数据库设计范式的缺点:
对业务的支持不太友好。
例如,上述所说的订单地址,如果地址不冗余,在发货期间用户更新了地址,那么这个订单的地址就会改变,这个订单信息就是错误的了。
数据库设计冗余的优点:
连表查询变成单表查询,速度提高。
数据库设计冗余的缺点:
空间和内存消耗大,数据不能同步更新,需要更多的程序来实现。
在实际业务中,一般都是看业务场景需要混合使用的,不能严格遵循数据库设计三大范式