1.范式的含义:
范式是符合某一种级别的关系模式的集合。构造数据库必须遵循一定的规则。关系数据库中,这种规则就是范式,关系数据库中的关系必须满足一定的要求,即满足不同的范式。满足这些规范的数据库是简洁的、结构明晰的,同时,不会发生插入(insert)、删除(delete)和更新(update)操作异常。
目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、第四范式(4NF)、第五范式(5NF)和Boyce-Codd范式(BCNF)。
满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多要求的称为第二范式(2NF),其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。
2.数据库设计三大范式
第一范式
确保每列保持原子性,每一列的属性值不可以再分
在下表中,class列明显可以再分为年级和班级,因此不满足第一范式
修改后:
第二范式:
- 前提是满足第一范式
- 确保表中的每列都和主键相关
订单信息表
这样就产生一个问题:这个表中是以订单编号和商品编号作为联合主键。这样在该表中商品名称、单位、商品价格等信息不与该表的主键相关,而仅仅是与商品编号相关。所以在这里违反了第二范式的设计原则。
修改后:
第三范式:
- 前提是满足第一范式和第二范式
- 确保每列都和主键列直接相关,而不是间接相关
比如在设计一个订单数据表的时候,可以将客户编号作为一个外键和订单表建立相应的关系。而不可以在订单表中添加关于客户其它信息(比如姓名、所属公司等)的字段。如下面这两个表所示的设计就是一个满足第三范式的数据库表。
这样在查询订单信息的时候,就可以使用客户编号来引用客户信息表中的记录,也不必在订单信息表中多次输入客户信息的内容,减小了数据冗余。
3.注意事项:
- 第二范式与第三范式的本质区别:在于有没有分出两张表。 第二范式是说一张表中包含了多种不同实体的属性,那么必须要分成多张表,第三范式是要求已经分好了多张表的话,一张表中只能有另一张标的ID,而不能有其他任何信息,(其他任何信息,一律用主键在另一张表中查询)。
- 必须先满足第一范式才能满足第二范式,必须同时满足第一第二范式才能满足第三范式。
- 规范和性能的问题:
关联查询的表不得超过三张表 考虑商业化的需求和目标,(成本、用户体验) 数据库的性能更加重要
在规范性能的问题的时候,需要适当的考虑规范性
故意给某些表增加一些冗余字段(从多表查询变成单表查询)
故意增加一些计算列(从大数据量变为小数据量)
第二范式和第三范式参考原文章:获取原文