范式,即数据库设计中的规范,是确保数据结构合理化的关键。它由关系数据库理论的先驱 E.F.Codd 在上世纪70年代提出,目前包括八种范式,但通常我们主要关注前三种:第一范式(1NF)、第二范式(2NF)和第三范式(3NF)。
第一范式(1NF)
强调列的原子性,即每一列都不可再分。
例如,考虑一个商品表:【商品】(商品编号,商品名称,商品属性)。如果商品属性包括多个值,如尺寸和颜色,就不符合1NF。为符合1NF,应拆分为【商品】(商品编号,商品名称,尺寸,颜色)。
第二范式(2NF)
在满足1NF的基础上,要求表有主键,并且非主键列必须完全依赖于主键,而不能只依赖于主键的一部分。
考虑一个订单明细表:【订单明细】(订单编号,商品编号,商品单价,数量)。因为商品单价只依赖于商品编号,而不是订单编号和商品编号的组合,所以不符合2NF。解决方法是将其分成【订单明细】(订单编号,商品编号,数量)和【商品】(商品编号,商品单价)两个表。
第三范式(3NF)
在满足2NF的基础上,要求非主键列直接依赖于主键,不能存在传递依赖。
例如,考虑一个客户订单表:【客户订单】(订单编号,订单日期,客户编号,客户姓名,客户地址,客户城市)。这里客户姓名、客户地址和客户城市依赖于客户编号,而不是直接依赖于订单编号,因此不符合3NF。解决方法是将其拆分为【客户订单】(订单编号,订单日期,客户编号)和【客户信息】(客户编号,客户姓名,客户地址,客户城市)两个表。
总结而言,1NF确保数据原子性,2NF消除部分依赖,3NF消除传递依赖。通过遵循这些范式,可以设计出结构清晰、高效的数据库模型,减少数据冗余和更新异常的发生。