转载自:原文链接
什么是数据库范式?
可以把它粗略地理解为一张数据表的表结构所符合的某种设计标准的级别。就像家里装修买建材,最环保的是E0级,其次是E1级,还有E2级等等。数据库范式也分为1NF,2NF,3NF,BCNF,4NF,5NF。
一般在我们设计关系型数据库的时候,最多考虑到BCNF就够。符合高一级范式的设计,必定符合低一级范式,例如符合2NF的关系模式,必定符合1NF。
基础概念理解
码:设 K 为某表中的一个属性或属性组,若除 K 之外的所有属性都完全函数依赖于 K(这个“完全”不要漏了),那么我们称 K 为候选码,简称为码。在实际中我们通常可以理解为:假如当 K 确定的情况下,该表除 K 之外的所有属性的值也就随之确定,那么 K 就是码。一张表中可以有超过一个码。(实际应用中为了方便,通常选择其中的一个码作为主码)。码中包含的属性称为主属性,此外的称为非主属性。
函数依赖:若在一张表中,在属性(或属性组)X的值确定的情况下,必定能确定属性Y的值,那么就可以说Y函数依赖于X,写作 X → Y。
完全函数依赖:在一张表中,若 X → Y,且对于 X 的任何一个真子集(假如属性组 X 包含超过一个属性的话),X ' → Y 不成立,那么我们称 Y 对于 X 完全函数依赖,记作 X F→ Y。(那个F应该写在箭头的正上方,没办法打出来)。
部分函数依赖:假如 Y 函数依赖于 X,但同时 Y 并不完全函数依赖于 X,那么我们就称 Y 部分函数依赖于 X,记作 X P→ Y。
传递函数依赖:假如 Z 函数依赖于 Y,且 Y 函数依赖于 X (Y 不包含于 X,且 X 不函数依赖于 Y这个前提),那么我们就称 Z 传递函数依赖于 X ,记作 X T→ Z
第一范式(1NF)
符合1NF的关系中的每个属性都不可再分。1NF是所有关系型数据库的最基本要求,不符合该范式的设计在创表的时候就会操作不成功。
第二范式(2NF)
2NF在1NF的基础之上,消除了非主属性对于码的部分函数依赖。
第三范式(3NF)
3NF在2NF的基础之上,消除了非主属性对于码的传递函数依赖。也就是说, 如果存在非主属性对于码的传递函数依赖,则不符合3NF的要求。
注:高级别的范式解决了低级别范式中存在的数据冗余过大,插入异常,删除异常,修改异常等问题中的部分或全部。