目录
三大范式
概念:设计数据库时,需要遵循的一些规范。要遵循后边的范式要求,必须先遵循前边的所有范式要求,总共有六大范式,我们今天只学习前面三个
设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小
我们从下面的这张表入手
第一范式(1NF)
每一列都是不可分割的原子数据项
这一个范式显然上表就不满足,此表中系还不是不可分割的原子项,还能分为系名和系主任,说明他们的列(系)还是可分割的
所以我们将他们拆分,继续分析,出现如下三点问题:
第二范式(2NF)
在1NF的基础上,非码属性必须完全依赖于主码属性(在1NF基础上消除非主属性对主码属性的部分函数依赖)
要弄懂第二范式,我们先要理解一下几个概念:
1. 函数依赖:A-->B,如果通过A属性(属性组)的值,可以确定唯一B属性的值。则称B依赖于A
例如:学号(属性)-->姓名。 学号,课程名称(属性组) --> 分数 (姓名依赖于学号,分数依赖于学号和课程名称)
2. 完全函数依赖:A-->B, 如果A是一个属性组,则B属性值得确定需要依赖于A属性组中所有的属性值。
例如:(学号,课程名称) --> 分数
3. 部分函数依赖:A-->B, 如果A是一个属性组,则B属性值的确定只需要依赖于A属性组中某一些值即可。
例如:(学号,课程名称) -- > 姓名:学号就能确定姓名,依赖于属性组的部分值
4. 传递函数依赖:A-->B, B -- >C . 如果通过A属性(属性组)的值,可以确定唯一B属性的值,在通过B属性(属性组)的值可以确定唯一C属性的值,则称 C 传递函数依赖于A
例如:学号-->系名,系名-->系主任
5. 码:如果在一张表中,一个属性或属性组,被其他所有属性所完全依赖,则称这个属性(属性组)为该表的主码,码说的是通过这个属性或者属性组,可以唯一确定其他的所有属性值
例如:该表中码为:(学号,课程名称)
* 码属性:码属性组中的所有属性
* 非主属性:除去码属性组属性的所有属性
从上面一系列属性我们可以得知此表的主码属性是(学号,课程名称),这两个属性可以完全确定其他的所有非主属性(姓名,系名,系主任,分数),而这四个非主属性中只有分数是完全依赖于主码属性,而其他三个属性姓名,系名,系主任则是依赖于主码属性中的部分属性——学号,所以第二范式就是要我们消除非主属性对主码属性的部分函数依赖,那我们就可以把姓名,系主任,系名独立出来成为另外一张表,如下所示
但是我们发现运用了第二范式后我们仅仅解决了第一个数据冗余的问题,而第二,第三个问题都没有得到解决,接下来就是我们第三范式登场了
第三方式(3NF)
在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
也就是说第三范式的根本目的是要我们做到消除传递依赖
而由上图我们可以看到学生表的主属性是学号,系名依赖于学号,而系主任依赖于系名,那么系主任就传递依赖于学号,所以我们要消除传递依赖,如下图所示,1,2,3问题全部解决