三范式的目的:
为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。
第一范式:(确保每列保持原子性)
第一范式是最基本的范式。数据库表里面字段都是单一属性的,不可再分。如一般需求:地址字段需要分成”省-->市-->县“,因此该字段只设计成一个字段就不合适,需要设计三个及以上字段。
这个单一属性有由基本类型构成,包括整型,字符型,逻辑型日期型。在当前的数据库管理系统当中不可能做出不符合第一范式的数据库,因为数据库管理系统不允许将表的一列再分成二列或者多列。因此想要设计出不符合第一范式的数据库是不可能的。
这样在对用户使用城市进行分类的时候就非常方便,也提高了数据库的性能。
第二范式(确保表中的每列都和主键相关,消除部分依赖。)
第二范式在第一范式的基础之上更进一层。第二范式需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。也就是说在一个数据库表中,只能有一个主键,而且主键只能为一个字段,不能是联合主键。
其实是将有数据冗余的数据表通过表和表之间的外键关联起来。在很大程度上减小了数据库的冗余。如要获取订单的商品信息,使用商品编号到商品信息表中查询即可。
第三范式(确保每列都和主键列直接相关,而不是间接相关,消除传递依赖,非主属性的依赖)
第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。比如在设计一个订单数据表的时候,可以将客户编号作为一个外键和订单表建立相应的关系。而不可以在订单表中添加关于客户其它信息(比如姓名、所属公司等)的字段。如下面这两个表所示的设计就是一个满足第三范式的数据库表。
在设计数据库的时候要最大程度遵循三范式,特别是对OLTP系统来说,三范式是必须遵循的规则。当然三范式最大的问题在于查询的时候要Join很多表,这会导致查询效率很低。这个时候基于性能考虑,我们需要违反三范式,适当的做冗余,达到提高查询效率的目的。注意这里反范式是适度的,必须为这种做法提供充分的理由。