第一范式
数据库表中的所有字段值都是不可分解的原子值
例如:这样一个表:【联系人】(姓名,性别,电话)
如果在实际场景中,一个联系人有家庭电话和公司电话,那么这种表结构设计就没有达到 第一范式。
要符合 第一范式 我们只需把列(电话)拆分,即:【联系人】(姓名,性别,家庭电话,公司电话)。
如下表:
姓名 | 性别 | 性别 | 家庭电话 | 公司电话 |
---|
张红欣 | 男 | 0123 | 336 | 0378-23459876 |
张丽丽 | 女 | 234 | 345 | 0371-23459876 |
第二范式
第二范式需要确保数据库表中的每一列都必须和'主键相关',包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。
这样设计,在很大程度上减小了数据库的冗余
例如:一个订单明细表:【OrderDetail】(OrderID,ProductID,UnitPrice,Discount,Quantity,ProductName)。
因为我们知道在一个订单中可以订购多种产品,所以单单一个 OrderID 是不足以成为主键的,主键应该是(OrderID,ProductID)。显而易见 Discount(折扣),Quantity(数量)完全依赖(取决)于主键(OderID,ProductID),而 UnitPrice,ProductName 只依赖于 ProductID。所以 OrderDetail 表不符合第二范式。容易产生冗余数据。
第三范式
确保数据表中的每一列数据都和主键直接相关,不能存在传递依赖。
即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。
例如:一个订单表【Order】(OrderID,OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity)主键是(OrderID)。
其中 OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity 等非主键列都完全依赖于主键(OrderID),所以符合 第二范式。不过问题是 CustomerName,CustomerAddr,CustomerCity 直接依赖的是 CustomerID(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合 第三范式。
通过拆分【Order】为【OrderNew】(OrderID,OrderDate,CustomerID)和【Customer】(CustomerID,CustomerName,CustomerAddr,CustomerCity)从而达到 第三范式。
第二范式和第三范式的概念很容易混淆,区分它们的关键点在于,第二范式:非主键列是否完全依赖于主键,还是依赖于主键的一部分;第三范式:非主键列是直接依赖于主键,还是直接依赖于非主键列。
这样设计,也是为了减小了数据库的冗余