设计数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式。常用的有第一范式,第二范式,第三范式,越高的范式数据库冗余越小。
一、第一范式:每一列都是不可分割的原子数据项
举例说明:
在上面的表中,“家庭信息”和“学校信息”列均不满足原子性的要求,故不满足第一范式,调整如下:
可见,调整后的每一列都是不可再分的,因此满足第一范式
缺点:存在一个问题就是,只满足第一范式的表很可能会存在数据冗余,例如:假如李白后来又读了个博士,或者李白从研二升到研三,然后表里就会有不止一条李白的数据,这其实并不是也别好的设计。
二、第二范式:在第一范式的基础上,非码属性必须完全依赖于码
即在第一范式的基础上,消除非主属性对主码的部分函数依赖。
第二范式需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。
主属性:指主键列,即主键由一列构成
主键定义:能够唯一标识一个元组的属性或属性集,即可以由多列组成。
举例说明:
在上图所示的情况中,同一个订单中可能包含不同的产品,因此主键必须是“订单号”和“产品号”联合组成,
但可以发现,产品数量、产品折扣、产品价格与“订单号”和“产品号”都相关,但是订单金额和订单时间仅与“订单号”相关,与“产品号”无关,
这样就不满足第二范式的要求,调整如下,需分成两个表:
三、第三范式:在第二范式的基础上,消除传递依赖
第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。
举例说明:
上表中,所有属性都完全依赖于学号,所以满足第二范式,但是“班主任性别”和“班主任年龄”直接依赖的是“班主任姓名”,
而不是主键“学号”,所以需做如下调整:
总结:
第一范式:主键与表中的其他列属性之间是1:1的关系,不可再次拆分
第二范式:主键(包括联合主键)与表中的其他列属性之间是1:1的关系,同时该主键(联合主键中的某一个主键)在另外一个表中也是主键,与其他列属性之间是1:1的关系,其实这两个表是可以合并为一个表的,只是部分列属性与主键(联合主键)之间是1:1关系,部分列属性与联合主键中的某一个键是1:1的关系,但是为了满足三大范式的定义要求,拆分开来成2张表
第三范式:主键与表中的其他列属性之间是1:1的关系,表中的某个字段为另外一个表的主键,在另外一个表中主键与其他列属性之间是1:1的关系,这样形成了第三范式