规范化
函数依赖FD
- 部分函数依赖:设X,Y是关系R的两个属性集合,存在X→Y,若X’是X的真子集,存在X’→Y,则称Y部分函数依赖于X。(通过AB能得出C,通过A也能得出C,通过B也能得出C,那么说C部分依赖于AB)
- 完全函数依赖:设X,Y是关系R的两个属性集合,X’是X的真子集,存在X→Y,但对每一个X’都有X’!→Y,则称Y完全函数依赖于X。(通过AB能得出C,但是AB单独得不出C,那么说C完全依赖于AB.)
- 传递函数依赖:设X,Y,Z是关系R中互不相同的属性集合,存在X→Y(Y !→X),Y→Z,则称Z传递函数依赖于X。(通过A得到B,通过B得到C,但是C得不到B,B得不到A,那么说C传递依赖于A)
码
在R(U)中,K⊆U,若K能完全函数确定U,则K为R(U)的候选码
(当K是属性组时,K的任何一部分都不能唯一标识元组 )。当候选码多于一个时,则选定其中的一个作为主码
。包含在任何候选码中的属性称主属性
;不包含在任何候选码中的属性为非主属性
。
范式
1NF
设R是关系模式,若R中每个属性A的值域中每个值都不可分解,则称关系R属于第一范式,记作R∈1NF。
2NF
若R∈1NF,且每个非主属性完全FD于码,则R∈2NF。
即2NF消除非主属性对码的部分FD。
3NF
关系模式R<U, F>中若不存在码X,属性组Y及非主属性Z(ZY),使得X→Y, Y→Z成立,但Y→X不成立,则R∈3NF。3NF消除了非主属性对于码的传递FD
BCNF
所有非主属性对每个码均完全FD;所有主属性对不包含它的码,也完全FD;没有任何属性完全FD于非码的属性组。若每个决定因素都含码,则R∈BCNF。
规范化的过程
- 1NF→2NF:消除非主属性对码的部分FD
- 2NF→3NF:消除非主属性对码的传递FD
- 3NF→BCNF:消除主属性对码的部分FD和传递FD;
数据依赖的公理系统
- A1(自反律):若YXU,则X→Y为F所蕴涵(平凡FD定义)
- A2(增广律):若X→Y为F所蕴涵,且ZU,则XZ→YZ为F蕴涵。
- A3(传递律):若X→Y且Y→Z,则X→Z为F所蕴涵。
- A4(合并规则):由X→Y,X→Z,有X→YZ;
- A5(伪传递规则):由X→Y,WY→Z,有WX→Z;
- A6(分解规则):由X→Y及ZY,有X→Z。
候选码的算法
(1)属性X,若在所有的FD中,只出现在左部或在Fm中不出现,则X必为主属性,且包含在任一候选码中;
(2)属性X,若在所有的FD中,只出现在右部,则X必为非主属性;
(3)其他属性,与主属性结合起来判断是否满足码的定义。
例:
模式的分解
无损连接性
模式分解前后表示同样的数据
R(U,F)的分解ρ={R1(U1,F1),R2(U2,F2)}是无损连接分解的充要条件:
U1∩U2→U1-U2∈F+ 或
U1∩U2→U2-U1∈F+
保持依赖性:F与{F1 ,…,Fk}等价
若,即二者等价,则R的分解ρ保持FD。
求最小依赖集:
关系模式R<U,F>,U={A,B,C,D,E},F={A→BC,ABD→CE,E→D},求F的最小依赖集。
- 第一步:F右边单一化
得到F1={A→B,A→C,ABD→C,ABD→E,E→D} - 第二步:逐个去掉X→A依赖后,设剩下函数依赖集为G,求属性集X关于G的闭包,如果闭包包含右边属性A,则去掉该函数依赖。
A→B:(A)+=AC,不包含B,保留。
A→C:(A)+=AB,不包含C,保留。
ABD→C:(ABD)+=ABCDE,包含C,去掉。
ABD→E:(ABD)+=ABCD,不包含B,保留。
E→D:(E)+=E,不包含D,保留。
(在这里,求闭包的时候,不能再用前面去掉的函数依赖了,所以最小依赖集不唯一,写出一个即可。)
所以F2={A→B,A→C,ABD→E,E→D} - 第三步:对左边属性单一化,X=B1B2…Bi,逐个用B1→A替代原依赖X→A,判断属性集(X-B1)关于F的闭包,如果包含A则用X-B1代替X。
ABD→E:A→E,求(BD)+=BD,不包含E,不冗余
B→E,求(AD)+=ABCDE,包含E,存在冗余则使用AD→E替换ABD→E
D→E,求(AB)+=ABC,不包含E,不冗余
所以F3={A→B,A→C,AD→E,E→D} - 继续第三步
AD→E:A→E,求(D)+=D,不包含E,不冗余
D→E,求(A)+=ABC,不包含E,不冗余 - 所以最小依赖集Fm={A→B,A→C,AD→E,E→D}
3NF保持依赖分解:
R(A,B,C)F={A->B,A->C}
先求最小依赖集合Fm={A->B,A->C}
分解得到R1(AB),R2(AC)
由于有相同的左边A,合并得{R(ABC)}
3NF保持依赖和无损分解:
R(C,T,S,N,G)F(C->T,CS->G,S->N)
求得最小依赖集为:F1={C->T,CS->G,S->N}
分解得{R1(CT),R2(CSG),R3(SN)}
找到候选键CS,得{R1(CT),R2(CSG),R3(SN),R4(CS)}