范式:英文名称是 Normal Form,它是英国人 E.F.Codd(关系数据库的老祖宗)在上个世纪70年代提出关系数据库模型后总结出来的,范式是关系数据库理论的基础,也是我们在设计数据库结构过程中所要遵循的规则和指导方法。
第一范式(1NF)
强调的是列的原子性,即列不能够再分成其他几列。
案例
现存在表:【联系人】(姓名,性别,电话)
其中列属性“电话”可以再拆分为“公司电话”与“家庭电话”,因此联系人表不符合1NF。
解决方法
更改表为:【联系人】(姓名、性别、公司电话、家庭电话)
第二范式(2NF)
基于1NF,包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分(主要针对联合主键而言)。
案例
现存在表:【订单明细】(OrderID,ProductID,UnitPrice,Discount,Quantity,ProductName)
一个订单中可以订购多种产品,所以单单一个 OrderID 是不足以成为主键的,主键应该是(OrderID,ProductID)。显而易见 Discount(折扣),Quantity(数量)完全依赖(取决)于主键(OderID,ProductID),而 UnitPrice(单价),ProductName(产品名称)只依赖于 ProductID。因此 OrderDetail 表不符合 2NF,容易产生冗余数据。
解决方法
可以把【OrderDetail】表拆分为【OrderDetail】(OrderID,ProductID,Discount,Quantity)和【Product】(ProductID,UnitPrice,ProductName)来消除原订单表中UnitPrice,ProductName多次重复的情况。
第三范式(3NF)
基于2NF,非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。
案例
现存在表:【订单】(OrderID,OrderDate,CustomerID,CustomerName,CustomerAddr)
其中 OrderDate(下单时间),CustomerID,CustomerName(购买者),CustomerAdd(购买者地址)等非主键列都完全依赖于主键(OrderID),所以符合 2NF。不过问题是 CustomerName,CustomerAddr直接依赖的是 CustomerID(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,因此不符合 3NF。
解决方法
通过拆分【Order】为【Order】(OrderID,OrderDate,CustomerID)和【Customer】(CustomerID,CustomerName,CustomerAddr)从而达到 3NF。
2NF与3NF的区别
二范式(2NF)和第三范式(3NF)的概念很容易混淆,区分它们的关键点在于,2NF:非主键列是否完全依赖于主键,还是依赖于主键的一部分;3NF:非主键列是直接依赖于主键,还是直接依赖于非主键列。