范式
1.1范式概念
为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。
范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。
1.2键和相关属性
范式的定义会用到键的概念,数据库中的键是由一个或多个属性组成的,下面是数据库表中常用的键和属性:
主键:主键是表中的一个字段或多个字段;可以唯一标识一条记录;主键是唯一的且不能为null;用户可以从候选键中选择一个作为主键。
外键:如果数据表A中的某属性集不是A的主键,而是另一个数据表B的主键,那么这个属性集就是数据表A的外键。
超键:超键是可以唯一标识元组的属性集;可能包含主键和其他属性。
候选键:如果超键不包含多余的属性,这个超键就是候选键,它可以理解为最小的超键。
主属性:包含在任何一个候选键上的属性叫作主属性。
非主属性:指的是不包含在任何一个候选键中的属性。
1.3第一范式(1NF)
第一范式主要是保证数据表中的每一个字段的值必须具有原子性,也就是数据表中的每个字段的值是不可再拆分的最小数据单元。
第一范式的合理遵循需要根据系统的实际需求来定。比如某些数据库系统中需要用到“地址”这个属性,本来直接将“地址”属性设计成一个数据库表的字段就行。但是如果系统经常会访问“地址”属性中的“城市”部分,那么就非要将“地址”这个属性重新拆分为省份、城市、详细地址等多个部分进行存储,这样在对地址中某一部分操作的时候将非常方便。这样设计才算满足了数据库的第一范式,如下表所示。
![](https://img-blog.csdnimg.cn/img_convert/58d4daf5cbe28685c279507fd62e332d.png)
1.4第二范式(2NF)
第二范式要求在满足第一范式的基础上。
数据表里的每一条数据记录,都是可唯一标识的,而且所有的非主键字段,都必须完全依赖主键,不能只依赖主键的一部分。
如下表这样设计数据库。
![](https://img-blog.csdnimg.cn/img_convert/53c378b410b29658efa8af40e63aae50.png)
1.5第三范式(3NF)
第三范式建立在已经满足第二范式的基础上。
数据表中的每一个非主键字段都和主键字段直接相关,也就是说数据表中的所有非主键字段不能依赖于其他非主键字段。
这个规则的意思是所有非主属性之间不能有依赖关系,它们是互相独立的。
比如设计班级教师表时,将班级编号作为外键和教师表建立对应的关系,不在教师表中添加班级表的其他信息。如下表。
![](https://img-blog.csdnimg.cn/img_convert/ad9c0bffecde614cf776d63ef42ce045.png)
1.6范式优缺点
优点:
数据的标准化有助于消除数据库中的数据冗余。
缺点:
1.降低了查询效率,因为范式等级越高,设计出来的表就越多,进行数据查询的时候就可能需要关联多张表,不仅代价昂贵,而且可能会使得一些索引失效。
2.范式只是提出设计的标标准,实际设计的时候,我们可能为了性能和读取效率违反范式的原则,通过增加少量的冗余或重复的数据来提高数据库的读取性能,减少关联查询,实现空间换时间的目的。