数据库系统原理与应用教程（016）—— 关系的规范化（一）

睿思达DBA_WGX

已于 2022-07-09 17:19:26 修改

阅读量2.3k

点赞数 6

分类专栏：数据库系统原理与应用教程：以MySQL为例文章标签：数据库 java 大数据

于 2022-07-09 17:09:11 首次发布

本文链接：https://blog.csdn.net/weixin_44377973/article/details/125696130

版权

数据库系统原理与应用教程：以MySQL为例专栏收录该内容

83 篇文章 36 订阅

订阅专栏

数据库系统原理与应用教程（016）—— 关系的规范化（一）

为了使关系模式设计的方法更加完善，人们提出了关系的规范化理论。范式是规范化的关系模式，由于规范化程度不同，产生了不同的范式。满足最基本规范化的关系模式叫第一范式，在第一范式的基础上，关系模式再满足其他一些约束条件就是第二范式、第三范式、BC 范式、第四范式、第五范式等。

一个低一级的关系范式通过模式分解可以转换为高一级范式的关系模式，这种过程称为关系的规范化。

一、关系模式规范化的必要性

关系数据库的设计主要是关系模式的设计。将关系模式规范化，使之达到较高的范式，是设计关系模式的主要途径。

1、关系模式应满足的基本要求

（1）元组的每个分量必须是不可分的数据项

这是关系的基本性质之一，如果不能满足，则表格就不是关系。如果表格中包含有组合属性，必须进行分解，使之转换为基本数据项。

（2）数据库中的数据冗余应尽可能少

数据冗余是指同一个数据重复存储。数据冗余会浪费大量的存储空间，由于数据重复存储，修改数据时可能造成数据不一致，增加数据维护的工作量。数据冗余还会造成数据查询和统计的困难，导致错误的结果。

对于关系数据库来说，实体之间的联系是通过外码来实现的，而外码就是一种数据冗余，外码是关系数据库不可消除的数据冗余。在设计数据库时，除了外码这种数据冗余之外，应消除其他不必要的数据冗余。

（3）关系数据库不能因为数据更新操作而引起数据不一致问题

如果数据库中存在不必要的数据冗余，同一个数据在多个地方重复存储。当执行数据修改时，这些冗余数据可能出现有的被修改，有的没有修改，从而造成数据不一致问题。数据不一致问题影响了数据的完整性。

数据不一致问题是由数据冗余造成的，如果消除了不必要的数据冗余，数据不一致问题也会得到解决。

（4）数据库中的数据不能在执行数据插入时出现插入异常问题

所谓插入异常是指希望插入的数据由于不能满足数据库完整性的要求，而不能正常地被插入到数据库。通俗地说插入异常就是应该插入的数据无法插入。例如下面的表格就存在数据冗余和插入异常问题：

教学关系：

学号	姓名	年龄	性别	系名	系主任	课程名	成绩
98001	李华	20	男	计算机系	王民	程序设计	88
98001	李华	20	男	计算机系	王民	数据结构	74
98001	李华	20	男	计算机系	王民	数据库	82
98001	李华	20	男	计算机系	王民	电路	65
98002	张平	21	女	计算机系	王民	程序设计	92
98002	张平	21	女	计算机系	王民	数据结构	82
98002	张平	21	女	计算机系	王民	数据库	78
98002	张平	21	女	计算机系	王民	电路	83
98003	陈兵	20	男	数学系	赵敏	高等数学	72
98003	陈兵	20	男	数学系	赵敏	数据结构	94
98003	陈兵	20	男	数学系	赵敏	数据库	83
98003	陈兵	20	男	数学系	赵敏	离散数学	87

以上的教学关系中，学生的信息和系的信息都是冗余的。其中，每个学生的信息冗余 4 次，计算机系的信息冗余 8 次，数学系的信息冗余 4 次。该表的主键为（学号，课程名），当一个系没有学生时，由于学号为空，系的信息无法插入；当一个学生没有选课时，由于课程名为空，则学生的信息无法插入；当一门课程没有学生选修，由于学号为空，导致课程的信息无法插入。这些都属于插入异常。

（5）数据库中的数据不能在执行删除操作时出现删除异常问题

删除异常是指在删除某些数据的同时把其他数据也删除了。通俗的说，删除异常就是删除了不该删除的信息。比如上面的教学关系中，如果要删除学生陈兵的信息，当陈兵的信息被删除时，数学系的信息也被删除了；当选修某门课程的学生的信息被删除时，该门课程的信息也被删除；当某个学生学习的所有的课程的信息被删除，则该学生的信息也会被删除。

（6）数据库设计应考虑查询要求，数据组织应合理

在数据库设计时，不仅要考虑自身的结构完整性，还要考虑数据的使用要求。为了使数据查询和数据处理高效简洁，比如对那些查询实时性要求高、操作频度大的数据，可以通过视图、索引和适当增加数据冗余的方法，增加数据库的可用性。

二、关系规范化的主要方法

如果一个关系模式存在数据冗余、插入异常和删除异常，其主要原因是数据库设计时没有按照“一事一地”的原则，多种信息存放到一个表中造成的。因此，关系规范化的主要方法就是对关系模式进行分解。

1、关系模式分解的原则

关系模式分解的原则：一事一地，保持联系！

一事一地：一个实体集分解为一个关系。

保持联系：分解之后实体集之间联系的信息不能丢失。

2、关系模式分解的步骤

以教学关系为例，上面的教学关系的关系模式为：

教学（学号，姓名，年龄，性别，系名，系主任，课程名，成绩）

步骤一：分析关系模式中包含哪些的实体集？

经过分析，教学关系包含三种实体集：学生，系，课程

步骤二：给每个实体集添加编码作为将来分解后的主键。

教学关系为每个实体集添加主键后如下：

教学（学号，姓名，年龄，性别，系编号，系名，系主任，课程号，课程名，成绩）

步骤三：按照一事一地的原则根据实体集对关系模式进行分解。

结果如下：

学生（学号，姓名，年龄，性别）

系（系编号，系名，系主任）

课程（课程号，课程名）

步骤四：分析实体集之间的联系，使用外码表示。

经过分析可知，系和学生之间存在一对多联系，在学生中添加系编号来表示。学生和课程之间存在多对多联系，增加一个选课表来表示。

结果如下：

系（系编号，系名，系主任）

学生（学号，姓名，年龄，性别，系编号）

课程（课程号，课程名）

选课（学号，课程号，成绩）

分解之后的关系模式内容如下：

系

系编号	系名	系主任
D01	计算机系	王民
D02	数学系	赵敏

学生

学号	姓名	年龄	性别	系编号
98001	李华	20	男	D01
98002	张平	21	女	D01
98003	陈兵	20	男	D02

课程

课程号	课程名
C01	程序设计
C02	数据结构
C03	数据库
C04	电路
C05	高等数学
C06	离散数学

选课

学号	课程号	成绩
98001	C01	88
98001	C02	74
98001	C03	82
98001	C04	65
98002	C01	92
98002	C02	82
98002	C03	78
98002	C04	83
98003	C05	72
98003	C02	94
98003	C03	83
98003	C06	87

分解之后的关系模式有效解决了上述问题。除了外码之外，消除了不必要的数据冗余。

对于系来说，即使一个系没有学生也可以插入该系的信息，反之，即使把所有学生的信息全部删除，系的信息也不会丢失。

对于学生来说，即使没有选修任何课程，学生的信息也可以插入。反之，即使把该学生的选课信息全部删除，学生的信息也不会丢失。

对于课程来说，即使该课程没有任何学生选修，课程的信息也可以插入。反之，即使把选修该课程的所有信息删除，该课程的信息也不会丢失。

以上关系模式在 MySQL 中实现如下：

/*
-- 系
create table dept(
    dept_id char(3) primary key,
    dept_name char(20),
    xzr char(20)
);

insert into dept values('D01','计算机系','王民');
insert into dept values('D02','数学系','赵敏');

-- 学生
create table stu(
    stu_id char(5) primary key,
    stu_name char(20),
    age int,
    gender char(4),
    dept_id char(3)
);

insert into stu values('98001','李华',20,'男','D01');
insert into stu values('98002','张平',21,'女','D01');
insert into stu values('98003','陈兵',20,'男','D02');

-- 课程
create table course(
    c_id char(3) primary key,
    c_name char(20)
);

insert into course values('C01','程序设计');
insert into course values('C02','数据结构');
insert into course values('C03','数据库');
insert into course values('C04','电路');
insert into course values('C05','高等数学');
insert into course values('C06','离散数学');

-- 选课
create table sc(
    stu_id char(5),
    c_id char(3),
    grade int
);

insert into sc values('98001','C01',88);
insert into sc values('98001','C02',74);
insert into sc values('98001','C03',82);
insert into sc values('98001','C04',65);
insert into sc values('98002','C01',92);
insert into sc values('98002','C02',82);
insert into sc values('98002','C03',78);
insert into sc values('98002','C04',83);
insert into sc values('98003','C05',72);
insert into sc values('98003','C02',94);
insert into sc values('98003','C03',83);
insert into sc values('98003','C06',87);

*/

mysql> select * from dept;
+---------+--------------+--------+
| dept_id | dept_name    | xzr    |
+---------+--------------+--------+
| D01     | 计算机系     | 王民   |
| D02     | 数学系       | 赵敏   |
+---------+--------------+--------+
2 rows in set (0.01 sec)

mysql> select * from stu;
+--------+----------+------+--------+---------+
| stu_id | stu_name | age  | gender | dept_id |
+--------+----------+------+--------+---------+
| 98001  | 李华     |   20 | 男     | D01     |
| 98002  | 张平     |   21 | 女     | D01     |
| 98003  | 陈兵     |   20 | 男     | D02     |
+--------+----------+------+--------+---------+
3 rows in set (0.00 sec)

mysql> select * from course;
+------+--------------+
| c_id | c_name       |
+------+--------------+
| C01  | 程序设计     |
| C02  | 数据结构     |
| C03  | 数据库       |
| C04  | 电路         |
| C05  | 高等数学     |
| C06  | 离散数学     |
+------+--------------+
6 rows in set (0.00 sec)

mysql> select * from sc;
+--------+------+-------+
| stu_id | c_id | grade |
+--------+------+-------+
| 98001  | C01  |    88 |
| 98001  | C02  |    74 |
| 98001  | C03  |    82 |
| 98001  | C04  |    65 |
| 98002  | C01  |    92 |
| 98002  | C02  |    82 |
| 98002  | C03  |    78 |
| 98002  | C04  |    83 |
| 98003  | C05  |    72 |
| 98003  | C02  |    94 |
| 98003  | C03  |    83 |
| 98003  | C06  |    87 |
+--------+------+-------+
12 rows in set (0.01 sec)

/*
select s.stu_id, s.stu_name, s.age, s.gender, d.dept_name, d.xzr, c.c_name, grade
from stu s, dept d, course c, sc
where s.dept_id = d.dept_id and s.stu_id = sc.stu_id and c.c_id = sc.c_id;
*/

mysql> select s.stu_id, s.stu_name, s.age, s.gender, d.dept_name, d.xzr, c.c_name, grade
    -> from stu s, dept d, course c, sc
    -> where s.dept_id = d.dept_id and s.stu_id = sc.stu_id and c.c_id = sc.c_id;
+--------+----------+------+--------+--------------+--------+--------------+-------+
| stu_id | stu_name | age  | gender | dept_name    | xzr    | c_name       | grade |
+--------+----------+------+--------+--------------+--------+--------------+-------+
| 98001  | 李华     |   20 | 男     | 计算机系     | 王民   | 程序设计     |    88 |
| 98001  | 李华     |   20 | 男     | 计算机系     | 王民   | 数据结构     |    74 |
| 98001  | 李华     |   20 | 男     | 计算机系     | 王民   | 数据库       |    82 |
| 98001  | 李华     |   20 | 男     | 计算机系     | 王民   | 电路         |    65 |
| 98002  | 张平     |   21 | 女     | 计算机系     | 王民   | 程序设计     |    92 |
| 98002  | 张平     |   21 | 女     | 计算机系     | 王民   | 数据结构     |    82 |
| 98002  | 张平     |   21 | 女     | 计算机系     | 王民   | 数据库       |    78 |
| 98002  | 张平     |   21 | 女     | 计算机系     | 王民   | 电路         |    83 |
| 98003  | 陈兵     |   20 | 男     | 数学系       | 赵敏   | 高等数学     |    72 |
| 98003  | 陈兵     |   20 | 男     | 数学系       | 赵敏   | 数据结构     |    94 |
| 98003  | 陈兵     |   20 | 男     | 数学系       | 赵敏   | 数据库       |    83 |
| 98003  | 陈兵     |   20 | 男     | 数学系       | 赵敏   | 离散数学     |    87 |
+--------+----------+------+--------+--------------+--------+--------------+-------+
12 rows in set (0.02 sec)