数据库的设计
多表之间的关系
- 一对一: 如人和身份证,一个人对一个身份证,一个身份证对一个人。
- 一对多(多对一): 如部门和员工,一个部门对多个员工,一个员工对一个部门。
- 多对多: 学生和课程,一个学生可以选多个课程,一个课程可被多个学生选择。
实现关系
- 一对多(多对一): 在多的一方建立外键,指向一的一方的主键。
- 多对多: 需要借助第三张中间表,中间表至少包含两个字段,这两个字段作为第三张表的外键,分别指向两张表的主键。
- 一对一: 在任意一方添加唯一约束的外键,指向另一方的主键。不过一般都放在一张表上。
数据库设计的范式
设计关系数据库时,遵循不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式成递次规范,越高的范式数据库冗余越小。
目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)、第五范式(5NF,又称为完美范式)。
分类(这里只说1、2、3NF):
第一范式:
每一列都是不可分割的原子数据项。
如:
存在的问题:
- 存在非常严重的数据冗余(重复)。
- 数据添加存在问题。
- 数据删除存在问题。
第二范式:
在1NF的基础上,非码属性必须完全依赖于候选码(在1NF的基础上消除非主属性对主码的部分函数依赖)。
几个概念:
- 函数依赖: A–>B,如果通过A属性(属性组)的值,可以确定唯一B属性的值,则称B依赖A,如学号–> 姓名 。(学号,课程名称)–>该课程分数。
- 完全函数依赖: A–>B,如果A是一个属性组,则B属性值得确定需要依赖于A属性组中所有的属性值,如(学号,课程名称)–>该课程分数。
- 部分函数依赖: A–>B,如果A是一个属性组,则B属性值得确定只需要依赖于A属性组中某些值即可,如(学号,课程名称)–>姓名。
- 传递函数依赖: A–>B,B–>C,如果通过A属性(属性组)的值,可以确定唯一B属性的值,再通过B属性(属性组)的值可以确定唯一C属性的值,则称C传递函数依赖于A,如:学号–>系名,系名–>系主任。
- 码: 如果在一张表中,一个属性或属性组,被其他所有属性所完全依赖,则称这个属性(属性值)为该表的码。
存在的问题:
- 数据添加存在问题。
- 数据删除存在问题。
第三范式:
在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF的基础上消除传递依赖)