数据库设计三范式(3NF)
数据库设计三范式是指数据库设计中用于确保数据结构合理,减少数据冗余和依赖性的一系列标准。通常,数据库设计遵循从 第一范式(1NF) 到 第三范式(3NF) 的过程。每一范式都在上一范式的基础上进行加强,消除不同类型的数据冗余和不合理的依赖关系。
第一范式(1NF)
定义:第一范式要求每个列的数据都是原子的,也就是说,每个列中的数据不可再分。具体来说,1NF 强调每个单元格存储的是单一的、不可分解的值。
关键点:
- 表中的每列必须是原子的,即一个字段不能存储多个值。
- 表的每一行都是唯一的,必须有主键(或唯一标识符)。
示例:
假设有一个 学生表
,其中一列是 课程
,该列可以存储多个课程信息,例如:
学生ID | 学生姓名 | 课程 |
---|---|---|
1 | 张三 | 数学, 英语, 物理 |
2 | 李四 | 化学, 生物 |
这种设计违反了1NF,因为“课程”列存储了多个值,必须将课程列拆分成多个单列来满足1NF。
修正后:
学生ID | 学生姓名 | 课程 |
---|---|---|
1 | 张三 | 数学 |
1 | 张三 | 英语 |
1 | 张三 | 物理 |
2 | 李四 | 化学 |
2 | 李四 | 生物 |
第二范式(2NF)
定义:第二范式在满足第一范式的基础上,要求消除 部分依赖。也就是说,表中的每一个非主键字段必须完全依赖于主键,而不能只依赖主键的一部分。
关键点:
- 表必须已经满足 第一范式。
- 表中的每个非主键列必须依赖于整个主键,而不是主键的一部分(这通常适用于复合主键的情况)。
- 消除部分依赖。
示例:
假设有一个 订单表
,其中包含复合主键(订单ID
和 商品ID
):
订单ID | 商品ID | 商品名称 | 订单日期 | 数量 |
---|---|---|---|---|
1001 | 2001 | 手机 | 2025-01-01 | 2 |
1001 | 2002 | 电视 | 2025-01-01 | 1 |
1002 | 2001 | 手机 | 2025-02-01 | 3 |
在这个表中,商品名称
只依赖于 商品ID
,而不是 订单ID
和 商品ID
的组合主键,因此存在 部分依赖。为了满足2NF,需要将 商品名称
单独提取到一个表中。
修正后的表:
订单表
:
订单ID | 商品ID | 订单日期 | 数量 |
---|---|---|---|
1001 | 2001 | 2025-01-01 | 2 |
1001 | 2002 | 2025-01-01 | 1 |
1002 | 2001 | 2025-02-01 | 3 |
商品表
:
商品ID | 商品名称 |
---|---|
2001 | 手机 |
2002 | 电视 |
第三范式(3NF)
定义:第三范式在满足第二范式的基础上,要求消除 传递依赖。也就是说,非主键字段不能依赖于其他非主键字段。
关键点:
- 表必须已经满足 第二范式。
- 表中的每个非主键列必须直接依赖于主键,而不能依赖于其他非主键列。
示例:
假设有一个 员工表
,其中包含员工的 部门名称
和 部门经理
:
员工ID | 员工姓名 | 部门名称 | 部门经理 |
---|---|---|---|
1 | 张三 | 技术部 | 王经理 |
2 | 李四 | 市场部 | 刘经理 |
在这个表中,部门经理
依赖于 部门名称
,而 部门名称
又依赖于主键 员工ID
,这就造成了 传递依赖。
修正后的表:
员工表
:
员工ID | 员工姓名 | 部门名称 |
---|---|---|
1 | 张三 | 技术部 |
2 | 李四 | 市场部 |
部门表
:
部门名称 | 部门经理 |
---|---|
技术部 | 王经理 |
市场部 | 刘经理 |
总结
- 第一范式(1NF):确保每个字段是原子的,不可再分的。
- 第二范式(2NF):在1NF的基础上,消除部分依赖,确保每个非主键字段完全依赖于主键。
- 第三范式(3NF):在2NF的基础上,消除传递依赖,确保非主键字段只依赖于主键。
设计范式的选择
- 在实际的数据库设计中,并不总是追求完全的 3NF。有时,3NF 会导致过多的表和复杂的查询。因此,有时会采用 反范式化(Denormalization)以提高查询性能,尤其是在需要高效读操作的 OLAP 系统中。