为了提高数据库应用系统的性能,这里,我们引入一个传统的概念——关系数据库规范化理论。
今天,我们主要了解一下——范式。
什么是范式呢?
当关系满足不同层次的要求时称为范式,满足最低要求的是第一范式,即1NF。
在关系数据库中,对关系模式的基本要求是满足1NF,实际应用中通常要求满足3NF。
关系模式的规范化过程是通过对关系模式的分解实现的,把低一级的关系模式分解为高一级的关系模式。
第一范式:
如果关系模式的每一个属性只包含单一的值,则关系模式满足1NF。
学号 | 姓名 | 课程名 | 成绩 |
090504001 |
陈丽 | 计算机辅助教育 | 89 |
课程整合 | 90 | ||
090504002 |
李辉 | 计算机辅助教育 | 85 |
课程整合 | 92 | ||
090504003 |
闫娜 | 计算机辅助教育 | 93 |
课程整合 | 87 |
上表中的课程名和成绩出现重复,不是单一值——每个学生的有多个成绩;为了满足1NF,我们可以得出下表:
学号 | 姓名 | 课程名 | 成绩 |
090504001 | 陈丽 | 计算机辅助教育 | 89 |
090504001 | 陈丽 | 课程整合 | 90 |
090504002 | 李辉 | 计算机辅助教育 | 85 |
090504002 | 李辉 | 课程整合 | 92 |
090504003 | 闫娜 | 计算机辅助教育 | 93 |
090504003 | 闫娜 | 课程整合 | 87 |
第二范式:
如果关系模式满足1NF,而且它的所有非主属性完全依赖于主属性,则关系模式满足2NF。
要得到一列的信息,需要通过所有主键,还是只需要使用部分的主键?
如果只需用到部分主键,则必须考虑拆分该表,使得所有的列确实匹配所有主键。
由1NF表可知:知道学生的学号便可知道学生的姓名,知道学生的学号和课程名便可知道成绩,所以,姓名完全依赖于学号,成绩完全依赖于学号和课程名。所以得到下面两个满足2NF的表:
学号 | 姓名 |
090504001 | 陈丽 |
090504002 | 李辉 |
090504003 | 闫娜 |
学号 | 课程名 | 成绩 |
090504001 | 计算机辅助教育 | 89 |
090504001 | 课程整合 | 90 |
090504002 | 计算机辅助教育 | 85 |
090504002 | 课程整合 | 92 |
090504003 | 计算机辅助教育 | 93 |
090504003 | 课程整合 | 87 |
第三范式:
如果关系模式满足2NF,而且它的所有非主属性都不传递依赖于主属性,则关系模式满足3NF。
任何数据都不能衍生自表中其他数据。
每个班级都有一名固定的老师,就是高中的班主任,大学的辅导员,师生关系如下:
师生关系(学号,班级,教师姓名)
但是如果现在更换教师,就要打乱整体的学号与班级的关系,班级与教师的关系;应该在班级与学生不改变的前提下更换教师,使得数据的更改在最小范围内,便得到以下的关系:
班级(学号,班级)
师生关系(班级,教师姓名)
现在如果更换教师,只需更改教师与班级之间的关系,而班级和学生的关系是不会发生改变的。
以上总结纯属个人拙见,若有不妥,恳请各位高手们指点~