【数据库】第五章-关系数据库设计理论(1-函数依赖)

沉睡的卡鳄

已于 2024-01-07 21:51:36 修改

阅读量153

点赞数 1

分类专栏：数据库学习笔记文章标签：数据库 database 学习笔记数据库开发

于 2023-10-17 21:07:08 首次发布

本文链接：https://blog.csdn.net/KARLGong/article/details/133894079

版权

数据库学习笔记专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章讨论了关系模式设计的优劣，重点介绍了数据依赖的概念，包括函数依赖的定义、分类（如完全函数依赖、部分函数依赖和传递函数依赖），以及Armstrong公理系统的应用。此外，文章还探讨了码的定义和最小依赖集的求解策略。

摘要由CSDN通过智能技术生成

关系模式设计的优劣之分

在以往的学校数据库的例子中，我们都是为学生S、院系D、学生院系表SD、课程C、选课记录SC等分别建表。那么其实也有另一种建表方法，就是将所有的信息都综合在一张UN表中。为了比较两种关系模式设计，考虑如下操作：

插入一个学生的信息：
- 在分别建表中，只需要为S表增加一个元组；
- 在UN表中，缺失除学生信息外的数据，会导致插入异常。
修改一个学生的信息：
- 在分别建表中，只需修改S中的信息；
- 在UN表中，需要修改所有包含该学生的元组。
删除一个学生的信息：
- 在分别建表中，只需删除S和SD、SC中的信息；
- 在UN表中，需要删除所有包含该学生的元组。极端情况下，如果某课程只有该名同学选，则该课程的信息也会被连带删除。

总之，UN表数据冗余和操作开销都很大，我们认为这样的关系模式设计是不好的。因此，关系模式不是设计出来就行，还有优劣之分。类似UN的设计之所以不好，是由于其关系内部属性之间的约束关系过于复杂。因此，探究关系数据库设计理论，研究数据之间的依赖关系，就很重要了。

数据依赖的概念

数据依赖是一个关系内部属性值之间相互依赖又相互制约的关系。在第二章数据库关系模式的四元式形式化描述 $R (U, D, Do m, F)$ 中， $F$ 就是依赖关系的集合。
数据依赖有许多种类型，其中最重要的有两种：

函数依赖
多值依赖

函数依赖

函数依赖的定义

设 $R (U)$ 是属性集 $U$ 上的关系模式， $X$ , $Y$ 是 $U$ 的子集，对于 $R (U)$ 的任意一个具体关系 $r$ 中的任意两个元组 $t$ , $s$ ，如果满足若 $t [X] = s [X]$ 则 $t [Y] = s [Y]$ ，则称 $X$ 函数确定 $Y$ 或 $Y$ 函数依赖于 $X$ 。记作 $X\rightarrow Y$ 。函数依赖英文为Functional Dependency，简写FD。
简单一点的说法：对于 $X$ 的每一个具体值， $Y$ 有唯一的值与之对应。则称 $X$ 函数确定 $Y$ 或 $Y$ 函数依赖于 $X$ 。

需要说明的是，如果关系 $r$ 中没有两个 $t [X] = s [X]$ 相等，也不能说 $Y$ 就一定不函数依赖于 $X$ 。这是因为函数依赖是语义范畴的概念，不能形式化证明一个函数依赖成立，只能通过语义确定。

注意到总有 $X$ 的子集函数依赖于 $X$ ，但这类依赖的研究意义不大。

函数依赖的术语

平凡和非平凡的函数依赖
对于函数依赖 $X\rightarrow Y$ ，若 $Y\subseteq X$ ，则称 $X\rightarrow Y$ 是平凡的函数依赖；若 $Y\not\subseteq X$ ，则称 $X\rightarrow Y$ 是非平凡的函数依赖。
决定因素
对于函数依赖 $X\rightarrow Y$ ， $X$ 叫做决定因素。

函数依赖与属性间的联系类型

$X$ 与 $Y$ 是1:1联系，如学号与身份证号，二者是相互函数决定/依赖的。
$X$ 与 $Y$ 是1:m联系，如系号与学号，有 $Y\rightarrow X$ 。
$X$ 与 $Y$ 是m:n联系，如学号与课程名，则 $X$ ， $Y$ 之间不存在函数依赖关系。

函数依赖的分类

完全函数依赖与部分函数依赖：
在 $R (U)$ 中，如果 $X\rightarrow Y$ ，且对任意 $X$ 的真子集 $X^{'}$ ，都有 $\nrightarrow Y$ ，则称 $Y$ 对 $X$ 完全函数依赖，记作 $X\xrightarrow[]{f}Y$ ，否则称为部分函数依赖，记作 $X\xrightarrow[]{p}Y$ 。
传递函数依赖：
在 $R (U)$ 中，如果 $X\rightarrow Y$ ， $Y\rightarrow Z$ ，且 $Y\nrightarrow X$ ，则称 $Z$ 对 $X$ 传递函数依赖，记作
- 注：如果 $X\rightarrow Y$ ， $Y\rightarrow Z$ ，一定有 $X\rightarrow Z$ ，但不一定是传递函数依赖。

码的再定义

有了函数依赖的关系后，我们可以重新定义码：
如果 $R (U, F)$ 中的属性或属性组合 $K$ ， $K\xrightarrow[]{f} U$ ，则称 $K$ 为 $R$ 的候选码。若候选码多于一个，则选定其中的一个作为主码。

函数依赖的Armstrong公理系统

$F$ 逻辑蕴含 $X\rightarrow Y$ 的定义

如果函数依赖 $X\rightarrow Y$ 能从 $R < U, F >$ 的 $F$ 中的函数依赖推出，则称 $F$ 逻辑蕴含 $X\rightarrow Y$ 。显然， $F$ 逻辑蕴含 $F$ 中的所有FD。

$F$ 的闭包 $F^+$ 的定义

在关系模式 $R < U, F >$ 中，为 $F$ 所逻辑蕴涵的函数依赖的全体称作 $F$ 的闭包，记作 $F^+$ 。

定理： $X\rightarrow Y$ 能够由 $F$ 根据Armstrong公理导出 $\iff$ $Y\subseteq X_F^+$ 。

属性集 $X$ 关于F的闭包 $X_F^+$ 的定义

在 $X$ 中， $X\subseteq U$ ，定义：
$\small X_F^+=\{\cup A|X\rightarrow A 能由F根据Armstrong公理系统推出\}$
注：有时候不太区分 $A$ 是一个元素还是集合，有的地方也这样写：
$\small X_F^+=\{A|X\rightarrow A 能由F根据Armstrong公理系统推出\}$

算法：求 $X_F^+$
Input：属性集 $X$ ，依赖集合 $F$
Output： $X_F^+$
$X_F^+$ := $X$
do
for $A\subseteq X_F^+$ do
if $A\rightarrow B$
then $X_F^+$ := $X_F^+\cup B$
until( $X_F^+$ 不再改变)

Armstrong公理系统的三条公理

对于关系 $R < U, F >$ ，有如下三条规则：

自反律：若 $\subseteq Y \subseteq U$ ，一定有 $F$ 逻辑蕴含 $Y\rightarrow X$ 。即之前提到的平凡函数依赖。
增广律：若 $F$ 逻辑蕴含 $X\rightarrow Y$ ，且 $Z\subseteq U$ ，则一定有 $XZ\rightarrow YZ$ 。（这里 $XZ$ 和 $Y Z$ 分别是 $X\cup Z$ 和 $Y\cup Z$ 的简写）
传递性：若 $F$ 逻辑蕴含 $X\rightarrow Y$ 和 $Y\rightarrow Z$ ，则一定有 $X\rightarrow Z$ 。

可以证明以上三条显然成立。

Armstrong公理系统三条推理规则

由以上三条公理还可以得到如下三条推理规则：

合并规则：若 $X\rightarrow Y$ ， $X\rightarrow Z$ ，有 $X\rightarrow YZ$
分解规则：若 $X\rightarrow Y$ ， $\subseteq Y$ ，有 $X\rightarrow Z$
伪传递规则：若 $X\rightarrow Y$ ， $WY\rightarrow Z$ ，有 $WX\rightarrow Z$ 。意思是添了新的条件，就能推出新的内容。

合并规则和分解规则实质上可以合并为如下规则：

$X\rightarrow Y_1Y_2\dots Y_n \iff X\rightarrow Y_i(i=1,2\dots n)$

Armstrong公理系统的有效性与完备性

有效性：指由 $F$ 出发根据Armstrong公理推导出来的每个函数依赖一定在 $F$ 所蕴含的函数依赖的全体之中。
完备性： $F$ 所蕴含的函数依赖的全体中的每一个函数依赖，必定可以由 $F$ 根据Armstrong公理导出

函数依赖集的等价与覆盖

函数依赖集 $F$ ， $G$ ，若 $F^+=G^+$ ，则称 $F$ 与 $G$ 等价，或者说 $F$ 覆盖 $G$ 且 $G$ 覆盖 $F$ 。

引理： $F^+=G^+ \iff F\subseteq G, G\subseteq F$

$F$ 的最小依赖集

$F$ 的最小依赖集，或称极小依赖集，或称最小覆盖，定义为满足以下三个条件的依赖集：

右部为单属性：对于 $F$ 中的任意依赖 $X\rightarrow A$ ， $A$ 一定是单属性。
左部无多余属性： $F$ 不存在 $X\rightarrow A$ ， $X$ 有真子集 $X'\subset X$ ，使 $(F-\{X\rightarrow A\})\cup \{X'\rightarrow A\}$ 与 $F$ 等价。
无多余FD： $F$ 不存在 $X\rightarrow A$ ，使 $F-\{X\rightarrow A\}$ 与 $F$ 等价。

算法：求 $F$ 的最小依赖集
Input: 函数依赖集 $F$
Output: 极小化后的 $F$

Step1：右部单属性化
for $FD_i=X\rightarrow Y \in F$ do
if $Y=A_iA_2...A_k$
then $F$ := $(F-\{FD_i\})\cup \{X\rightarrow A_1, X\rightarrow A_2,...,X\rightarrow A_k\}$

Step2：消除左部多余属性
for $FD_i=X\rightarrow A \in F$ do
if $X=B_iB_2...B_k$ then
for $B_i\subseteq X$ do
if $A\in (X-B_i)_F^+$
then $F$ := $(F-\{FD_i\})\cup \{(X-B_i)\rightarrow Y\}$

Step3：消除多余FD
do
for $FD_i=X\rightarrow A \in F$ do
if $A\in X_{F-\{FD_i\}}^+$
then $F$ := $F-\{FD_i\}$
until $F$ 不再改变

注：不同的最小化顺序，所得的最小依赖集可能不一样。最小依赖集可能不是唯一的。