本文是关系数据理论章节的总结
目录
1. 问题的提出
关系模式由五部分组成,是一个五元组: R(U, D, DOM, F)
R是符号化的元组语义
U为一组属性
D为属性组U中的属性所来自的域
DOM为属性到域的映射
F为属性组U上的一组数据依赖
作为一个二维表,关系要符合一个最基本的条件:每一个分量必须是必不可分的数据项,满足这个条件的关系模式就属于第一范式(1NF)
数据依赖是一个关系内部属性与属性之间的一种约束关系,其中最重要的是函数依赖和多值依赖。
关系模式中存在的问题:
(1)数据冗余
浪费大量的存储空间:每一个系主任的姓名重复出现
(2)更新异常
更新数据时,维护代价大:某系更换系主任后,须修改有关的每一个元组。
(3)插入异常
如果一个系刚成立,尚无学生,则无法把这个系及其系主任存入数据库。
(4)删除异常
如果某个系的学生全部毕业了, 则在删除该系学生信息的同时,把这个系及其系主任的信息也丢掉了。
一个好的模式应当不会发生插入异常、删除异常和更新异常,数据冗余应尽可能少。
2. 规范化
2.1 函数依赖
设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若