一.数据库的码
1.码是数据库系统中的基本概念,所谓码就是能唯一标识实体的属性,它是整个实体集的性质,而不是单个实体的性质。它包括超码、候选码和主码。
(1)超码是一个或多个属性的集合,这些属性可以让我们在一个实体集中唯一地表示一个实体。如果K是一个超码,那么所有包含K的集合也是超码。
(2)候选码是从超码中选出来的,自然的候选码也是一个或多个属性的集合。候选码是最小的超码,它的任意真子集都不能成为超码。
(3)主码是被数据库设计者选中的,用来在同一实体集中区分不同实体的候选码。
二.4个范式之间的区别
1.第一式: 所有属性都是不可分割的基本属性。在一个关系中,消除重复字段,且各字段都是最小的逻辑存储单位。
2.第二范式: 所有非主属性都完全函数依赖于主码。若关系模型属于第一范式,则关系中每一个非主关键字段都完全依赖于主关键字段,不能只依赖于主关键字的一部分。
3.第三范式: 所有非主属性都不传递依赖于主码。若关系属于第一范式,且关系中所有非主关键字段都只依赖于主关键字段,第三范式要求去除传递依赖。
4.BC范式: 所有属性都不传递依赖于主码
5.4种范式之间的关系:BCNF<=3NF<=2NF<=1NF
1NF
| 消除非主属性对键的部分函数依赖
2NF
| 消除非主属性对键的传递函数依赖
3NF
| 消除主属性对键的传递函数依赖
BCNF
1. 第一范式(1NF):无重复的列,属性不可拆分,就是一个属性不允许再分成多个属性来建立列。
2. 第二范式(2NF):完全函数依赖,属性完全依赖于主键。
先讲讲什么是部分函数依赖。
部分函数依赖,就是多个属性决定另一个属性,但事实上,这多个属性是有冗余的。例如,(学号,班级)->姓名
,事实上,只需要学号就能决定姓名,因此班级是冗余的,应该去掉。
满足第二范式的数据库设计必须先满足第一范式。
因此第二范式的目标就是消除函数依赖关系中左边存在的冗余属性。
3.第三范式(3NF): 属性不依赖于其它非主属性
消除传递依赖
不依赖于其他非主属性(消除传递依赖)。
满足第三范式的数据库必须先满足第二范式。
也就是,数据库中的属性依赖仅能依赖于主属性,不存在于其他非主属性的关联。
例如,图书,图书室的关系。图书包括编号、出版商、页码等信息,图书室包括图书室编号、所存图书(外键)。其中,图书室的表中不应该存储任何图书的具体信息(例如,出版商。。),而只能通过主键图书编号来获得对应图书的信息。
4.BC范式(BCNF):
(1)所有非主属性对每一个码都是完全函数依赖;
(2)所有的主属性对于每一个不包含它的码,也是完全函数依赖;
(3)没有任何属性完全函数依赖于非码的任意一个组合。
R属于3NF,不一定属于BCNF,如果R属于BCNF,一定属于3NF。
5.第四范式(4NF): 禁止主键列和非主键列一对多关系不受约束
对于每一个X->Y,X都能找到一个候选码(?若关系中的某一属性组的值能唯一地表示一个元组,而其真子集不行,则称该属性组为候选码)。
最后举个例子(网上的):
学生表
学号
姓名
教师学生关系编号
系编号
爱好编号
一范式,就是表里的字段不能在划分属性了。
二范式,满足一范式基础,表里不存在与学号没关系的信息
三范式,满足二范式的基础上,表里不存在其他字段的关联,
BC范式,满足三范式的基础上,就是学生表里的每行都不存在重复的信息
第四范式,满足BC范式,就是连爱好这样字段,也不能出现 ”篮球,足球“;要建立一个爱好编号表,