什么是范式?
范式是数据库设计时遵循的一种规范,不同的规范要求遵循不同的范式。
最常用的三大范式
第一范式(1NF):属性不可分割,即每个属性都是不可分割的原子项。(实体的属性即表中的列)
第二范式(2NF):满足第一范式;且不存在部分依赖,即非主属性必须完全依赖于主属性。(主属性即主键;完全依赖是针对于联合主键的情况,非主键列不能只依赖于主键的一部分)
第三范式(3NF):满足第二范式;且不存在传递依赖,即非主属性不能与非主属性之间有依赖关系,非主属性必须直接依赖于主属性,不能间接依赖主属性。(A -> B, B ->C, A -> C)
举例说明3NF:
1NF
属性不可再分,即表中的每个列都不可以再进行拆分。
如下学生信息表(student):
id、name(姓名)、sex_code(性别代号)、sex_desc(性别描述)、contact(联系方式)
primary key(id)
id | name | sex_code | sex_desc | contact |
---|---|---|---|---|
001 | 张三 | 0 | 男 | 17835201234_山西省运城市xx村 |
002 | 李四 | 0 | 男 | 17735204567_山西省吕梁市yy村 |
003 | 王五 | 1 | 女 | 18835207890_山西省太原市zz村 |
如果在查询学生表时经常用到学生的电话号,则应该将联系方式(contact)这一列分为电话号(phone)和地址(address)两列,这样才符合第一范式。
修改使表满足1NF后:
id | name | sex_code | sex_desc | phone | address |
---|---|---|---|---|---|
001 | 张三 | 0 | 男 | 17835201234 | 山西省运城市xx村 |
002 | 李四 | 0 | 男 | 17735204567 | 山西省吕梁市yy村 |
003 | 王五 | 1 | 女 | 18835207890 | 山西省太原市zz村 |
判断表是否符合第一范式,列是否可以再分,得看需求,如果将电话号和地址分开才能满足查询等需求时,那之前的表设计就是不满足1NF的,如果电话号和地址拼接作为一个字段也可以满足查询、存储等需求时,那它就满足1NF。
2NF
在满足1NF的前提下,表中不存在部分依赖,非主键列要完全依赖于主键。(主要是说在联合主键的情况下,非主键列不能只依赖于主键的一部分)
如下学生成绩表(score):
stu_id(学生id)、kc_id(课程id)、score(分数)、kc_name(课程名)
primary key(stu_id, kc_id)
stu_id | kc_id | score | kc_name |
---|---|---|---|
001 | 1011 | 85 | 高数3-1 |
001 | 1022 | 79 | 计算机组成原理 |
002 | 1011 | 59.9 | 高数3-1 |
表中主键为stu_id和kc_id组成的联合主键。满足1NF;非主键列score完全依赖于主键,stu_id和kc_id两个值才能决定score的值;而kc_name只依赖于kc_id,与stu_id没有依赖关系,它不完全依赖于主键,只依赖于主键的一部分,不符合2NF。
修改使表满足2NF后:
成绩表(score) primary key(stu_id)
stu_id | kc_id | score |
---|---|---|
001 | 1011 | 85 |
001 | 1022 | 79 |
002 | 1011 | 59.9 |
课程表(kc) primary key(kc_id)
kc_id | kc_name |
---|---|
1011 | 高数3-1 |
1022 | 计算机组成原理 |
将原来的成绩表(score)拆分为成绩表(score)和课程表(kc),而且两个表都符合2NF。
3NF:
在满足2NF的前提下,不存在传递依赖。(A -> B, B -> C, A->C)
如下学生信息表(student):
primary key(id)
id | name | sex_code | sex_desc | phone | address |
---|---|---|---|---|---|
001 | 张三 | 0 | 男 | 17835201234 | 山西省运城市xx村 |
002 | 李四 | 0 | 男 | 17735204567 | 山西省吕梁市yy村 |
003 | 王五 | 1 | 女 | 18835207890 | 山西省太原市zz村 |
表中sex_desc依赖于sex_code,而sex_code依赖于id(主键),从而推出sex_desc依赖于id(主键);sex_desc不直接依赖于主键,而是通过依赖于非主键列而依赖于主键,属于传递依赖,不符合3NF。
修改表使满足3NF后:
学生表(student) primary key(id)
id | name | sex_code | phone | address |
---|---|---|---|---|
001 | 张三 | 0 | 17835201234 | 山西省运城市xx村 |
002 | 李四 | 0 | 17735204567 | 山西省吕梁市yy村 |
003 | 王五 | 1 | 18835207890 | 山西省太原市zz村 |
性别代码表(sexcode) primary key(sex_code)
sex_code | sex_desc |
---|---|
0 | 男 |
1 | 女 |
将原来的student表进行拆分后,两个表都满足3NF。
什么样的表越容易符合3NF?
非主键列越少的表。(1NF强调列不可再分;2NF和3NF强调非主属性列和主属性列之间的关系)
如代码表(sexcode),非主键列只有一个sex_desc;
或者将学生表的主键设计为primary key(id,name,sex_code,phone),这样非主键列只有address,更容易符合3NF。