简单来说三句话:
- 第一范式:列不可分;
- 第二范式:不存在部分依赖;
- 第三范式:不存在传递依赖。
第一范式:原子性,每一个字段不可再分(每一字段信息应该能分就分,分到不可再分为止)
例如:
第二范式::唯一性,不可以把多种数据保存在同一张表中,即一张表只能保存“一种”数据。(表内数据各管各的,不能互相影响)
不符合第二范式的表:学号, 姓名, 年龄, 课程名称, 成绩, 学分;
可能会存在问题:
- 数据冗余:每条记录都含有相同信息; (可能两个人选择相同的课程,学分就会重复)
- 删除异常:删除所有学生成绩,就把课程信息全删除了; (只想删除成绩信息,课程信息会连带一起删除,无法保留课程信息)
- 插入异常:学生未选课,无法记录进数据库; (只有学生信息,没有课程信息,这一行信息内容不完整,无法写进表里)
- 更新异常:调整课程学分,所有行都调整。
正确做法:
学生:(学号, 姓名, 年龄);
课程:(课程名称, 学分);
成绩:(学号, 课程名称, 成绩)。
第三范式:直接性,每一列都和主键直接相关,而不能间接相关。(依赖不准传递,决定某字段的值必须是主键)
不符合第三范式的表: 学号, 姓名, 年龄, 学院名称, 学院电话,因为存在依赖传递: (学号) → (学生)→(所在学院) → (学院电话) 。
学生是由学号决定,学院电话是由学院决定,而不是学号。
可能会存在问题:
- 数据冗余:有重复值;
- 更新异常:有重复的冗余信息,修改时需要同时修改多条记录,否则会出现数据不一致的情况
正确做法:
学生:(学号, 姓名, 年龄, 所在学院);
学院:(学院, 电话)。