之前对三大范式的概念很模糊,每次看一下概念描述过了几天就忘了,私自觉得还是这个只是过于概念化或者说自己没有理解到底,所以这个情况一直得不到解决。在最近了解了E-R图后,突然恍然大悟,写一篇短文记录下三大范式和E-R图的联系和E-R图对三大范式的解释,而E-R图就是Entity-Relationship实体-关系图,实体指表中的数据元素,而关系是描述这些数据元素的逻辑结构,这里需要对数据结构有一定认识。
首先,还是先贴一下三大范式的概念,如下:
I.第一范式(确保每列保持原子性)
原子性保证了表中所有属性列不可再分割,这个概念还算比较容易理解,要求每一列的值都不可再分割成多个值
II.第二范式(消除对主键的部分函数依赖)
在1NF的基础上,非码属性必须完全依赖于候选码(在1NF基础上消除非主属性对主码的部分函数依赖)
"候选码"是指若关系中的某一属性或属性组的值能够唯一的标识一个元祖,而其任何子集都不能再标识,则该属性组为候选码,比如现在有一个关系:工人(工号,身份证号,姓名,性别,部门),显然工号和身份证都能够唯一标识这个关系,那么工号、身份证号就都是候选码(候选码中的任一属性都是主属性),就可以从这两个属性选取一个属性作为主键 (primary key),注意:在其它关系中,可以从候选码选取多个属性作为主码。
"非主属性"是指不包含在候选码内的其它属性。
III.第三范式(消除对主键的传递依赖)
在2NF的基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
下面配合E-R图讲解一下三大范式,假如学生表需要包含以下属性,关系如下:
学号 | 课程号 | 姓名 | 性别 | 成绩 | 班主任信息 |
---|---|---|---|---|---|
132501 | 101 | 赵剑锋 | 男 | 80 | 梁远晓,35 |
132502 | 103 | 何玉英 | 女 | 90 | 李如天,50 |
首先看第一范式是否符合,在"班主任信息"中的值包含了两部分信息,包括值类型为整形的"班主任年龄"以及字符串类型的"班主任姓名",不符合不可再分割的约束,要使得关系符合1NF,可以改成以下关系:
学号 | 课程号 | 姓名 | 性别 | 成绩 | 班主任姓名 | 班主任年龄 |
---|---|---|---|---|---|---|
132501 | 101 | 赵剑锋 | 男 | 80 | 梁远晓 | 35 |
132502 | 103 | 何玉英 | 女 | 90 | 李如天 | 50 |
以上是符合1NF的,2NF要求在1NF的基础上取消对主键的部分函数依赖,这里需要用关系图来分析,符合1NF后的学生表E-R图如下: