关系数据库中的关系是要满足一定要求的,满足不同程度要求的为不同范式,满足最低要求的叫第一范式,简称1NF;在第一范式中进一步满足要求的为第二范式,其余依次类推。
其中数据的三个重要范式就是第一,第二,第三范式。
范式就是数据库存储数据时的一些要求。
第一范式:当关系模式R(relationship)的所有属性都不能在分解为更基本的数据单位时,称R是满足第一范式的,简记为1NF。满足第一范式是关系模式规范化的最低要求。
第二范式:关系模式R在满足第一范式的条件下,R的所有非主属性都完全依赖于R的每一个候选关键属性,称R满足第二范式,简记为2NF。
第三范式:设R是一个满足第一范式条件的关系模式,X是R的任意属性集,如果X非传递依赖于R的任意一个候选关键字,称R满足第三范式,简记为3NF.
上面的话有点太过官方,下面理解一下:
关系实质上是一张二维表,其中每一行是一个元组,每一列是一个属性
第一范式
1、每一列属性都是不可再分的属性值,确保每一列的原子性。
2、两列的属性相近或相似或一样,尽量合并属性一样的列,确保不产生冗余数据
第二范式
每一行的数据只能与其中一列相关,即一行数据只做一件事。只要数据列中出现数据重复,就要把表拆分开来。
比如说一个人同时订几个房间,就会出来一个订单号多条数据,这样子联系人都是重复的,就会造成数据冗余。我们应该把这个联系人选项拆开来、
这样便实现了一条数据做一件事,不掺杂复杂的关系逻辑。同时对表数据的更新维护也更易操作。
第三范式:
数据不能存在传递关系,即每个属性都跟主键有直接关系而不是间接关系。像:a-->b-->c 属性之间含有这样的关系,是不符合第三范式的。
比如Student表(学号,姓名,年龄,性别,所在院校,院校地址,院校电话)
这样一个表结构,就存在上述关系。 学号--> 所在院校 --> (院校地址,院校电话)
这样的表结构,我们应该拆开来,如下。
(学号,姓名,年龄,性别,所在院校)--(所在院校,院校地址,院校电话)
三大范式只是一般设计数据库的基本理念,可以建立冗余较小、结构合理的数据库。如果有特殊情况,当然要特殊对待,数据库设计最重要的是看需求跟性能,需求>性能>表结构。所以不能一味的去追求范式建立数据库。
总结起来:
第一范式:将属性相同的归为一列。每一列都是不可分割的原子属性。
第二范式:每一行数据只能与一列数据有关,即一行数据只能影响某一列属性的事。
第三范式:每个属性都跟主键有直接关系而不是间接关系。即属性之间不存在传递关系。
参考:https://www.cnblogs.com/knowledgesea/p/3667395.html。