设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。
第一范式(1NF)
符合1NF的关系中的每个属性都不可再分。每一列都是原子性。所有关系型数据库最少要满足的情况。
比如下表:
ID | 姓名 | 专业 | 年级 | 老师 |
---|---|---|---|---|
1 | 小明 | 计算机 | 3 | 赵宏宇 |
2 | 小红 | 生物 | 4 | 刘德华 |
无其他依赖表。
每一个属性是原子性的。
可能会造成的情况:数据冗余,删除异常,修改异常,插入异常
由上表分析
数据冗余:计算机会被存储多次。
删除异常:表里没有计算机专业的学生以后,不代表没有了计算机这个专业
修改异常:如果有两个计算机的学生换了专业,那他们两个的老师这一属性也要跟着修改
插入异常:如果增加法律专业,必须得有法律学生插入才可以。
第二范式(2NF)
2NF在1NF的基础之上,消除了部分函数依赖。
确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关,一个表中只能保存一种数据,不可以把多种数据保存在同一张数据库表中。
举例:
学号 | 姓名 | 专业 | 年级 | 老师 |
---|---|---|---|---|
10010 | 小明 | 计算机 | 3 | 赵宏宇 |
10011 | 小红 | 生物 | 4 | 刘德华 |
如果将学号和专业作为主键,那小明对(学号,专业)的依赖就是部分函数依赖。
第三范式(3NF)
3NF在2NF的基础之上,消除了传递函数依赖
第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。
学号 | 姓名 | 专业 | 年级 | 老师 |
---|---|---|---|---|
10010 | 小明 | 计算机 | 3 | 赵宏宇 |
10011 | 小红 | 生物 | 4 | 刘德华 |
学号->系名,系名->系主任,这就是传递函数依赖。
要改造的话
学生(学号,姓名,系名)
系(系名,系主任)
就完成了第三范式。