一、基础知识
- 关系型数据库 : 多张表 + 各表之间的关系。
关系、元祖、属性 : 元组是关系数据库中的基本概念,关系是一张表,表中的一行 (即数据库中的每条记录) 就是一个元组,表中的一列就是一个属性。
- 关系 : 表
- 元祖 : 表中的一行。
- 属性 : 表中的一列。
-
码 : 由一个或多个属性组成,能唯一标识实体 (表中的一行) 的属性集就叫做码,码包含超码、候选码、主码。
超码 : 能唯一标识实体 (表中的一行) 的属性集,超码可能包含多余的属性。
候选码 : 能唯一标识实体 (表中的一行) 的属性集,候选码不能包含多余的属性。候选码有时也简称为码。
----
举个例子 :
现有一张表Student,表中有3个属性 : 学号、身份证号、姓名。已知学号和身份证号都能唯一标识一个学生。
超码 : 所以只要包含学号或身份证号的属性集就是超码,如 : {学号}、{学号、身份证号}、{学号、姓名}、{学号、身份证号、姓名}、{身份证号}、{身份证号、姓名}等,这些码当中是包含一些多余属性的,比如我们只需要一个“学号”属性即可,却还包含了“姓名”属性。
候选码 : 而候选码是不能包含多余属性的,因此候选码只有 : {学号}、{身份证号} (这里假设姓名不唯一)。
----
主码 : 即主键,候选码中挑一个。
外码 : 即外键,如果一个表中的属性集是另一个表的主键,就称为外键,一般不推荐使用外键。
参考资料 : https://www.jianshu.com/p/58449b4882f8 -
主属性 : 候选码中的属性都称为主属性。与之相对的就称为非主属性。
-
闭包 : 简单来说,闭包就是一组属性能够 (通过关系) 直接或间接推导出的所有属性的集合。例如 :
闭包的求法 : https://www.bilibili.com/video/BV1pE411M7cC?spm_id_from=333.999.0.0 -
数据库中的范式 :
(范式即Normal Form,简写NF;第一范式、第二范式等也用数字+NF进行简写)
1) 第一范式 (1NF) : 表中的每一列都不可再拆分 (原子性)。1NF是所有关系型数据库的最基本要求,也就是说,只要在关系型数据库中已经存在的数据表,一定是符合1NF的。
缺点 :
2) 第二范式 (2NF) :
前置知识 : ①函数依赖 :
② 完全函数依赖 :
对比 : 函数依赖可能包含多余属性,函数依赖和完全函数依赖的感觉就类似于超码和候选码的关系。
③ 部分函数依赖 :
④ 传递函数依赖 :
参考资料 (如果对依赖不太清楚,可以看参考资料中给出的例子) : https://blog.csdn.net/weixin_49343190/article/details/117435819?spm=1001.2014.3001.5502
⑤ 候选码、主属性、非主属性 : 见上文。
第二范式的概念 : 在1NF的基础上,没有非主属性对候选码存在部分函数依赖的情况。
有点拗口,总之就是,如果一张表里面,有非主属性对候选码存在部分函数依赖的情况,这个表就不符合2NF的要求,只能说符合1NF的要求。
看了例子会更好理解,例子见上文讲依赖处的参考资料。
判断是否为2NF :
将1NF 转化成2NF :
3) 第三范式 (3NF)
概念 : 在2NF的基础上,不能有非主属性对候选码存在传递函数依赖。
参考资料 : (一定要耐心看这篇,写的很通俗易懂)
https://blog.csdn.net/weixin_49343190/article/details/117435819?spm=1001.2014.3001.5502
4) BCNF范式 :