数据库技术基础(二)
一、关系代数
1、并、交、差
1.并
2.交
3.差(S1-S2 与 S2-S1是不一样的)
2、笛卡尔积、投影、选择
1.笛卡尔积
2.投影(πSno,Sname(S1))
3.选择(σSno=No0003(S1))
3、自然连接
属性列数:二者之和 减去 重复列数
元组行:同名属性列取值相等
S1⋈S2 = π1,2,3,5(σ1=4(S1 X S2))
先做选择再做投影
二、规范化理论
1、规范化理论基本概念
1、函数依赖
设R(U)是属性U上的一个关系模式,X和Y是U的子集,r为R的任一关系,如果对于r中的任意两个元组u,v,只要有u[X]=v[X],就有u[Y]=v[Y],则称X函数决定Y,或称Y函数依赖于X,记为X→Y。
(X:决定因素 Y:被决定因素)
部分函数依赖(部分依赖):主键是两个属性的组合键,若主键中的一部分可以确定某个属性,则为部分函数依赖
传递函数依赖(传递依赖):即:若A可以确定B,B可以确定C,则A可以确定C(注意:B不能确定A,因为此时二者即为等价)
2、Amstrong公理体系
关系模式R<U,F>来说有以下的推理规则:
A1.自反律(Reflexivity):若Y⊆X⊆U,则X→Y成立。
A2.增广律(Augmentation):若Z⊆U且X→Y,则XZ→YZ成立。
A3.传递律(Transitivity):若X→Y且Y→z,则X→Z成立。
根据A1,A2,A3这三条推理规则可以得到下面三条推理规则:
合并规则:由X→Y,X→Z,有X→YZ。(A2,A3)
伪传递规则:由X→Y, WY→Z,有XW→Z。(A2,A3)
分解规则:由X→Y及Z⊆Y,有X→Z。(A1,A3)
3、候选键、主属性与非主属性
1.候选键
图示法求候选键
①将关系的函数依赖关系,用 “有向图” 的方式表示。
②找出入度为0的属性,并以该属性集合为起点,尝试遍历有向图,若能正常遍历图中所有结点,则该属性集即为关系模式的候选键。
③若入度为0的属性集不能遍历图中所有结点,则需要尝试性的将一些中间结点(既有入度,也有出度的结点)并入到入度为0的属性集中,直至该集合能遍历所有结点,集合为候选键。
2.主属性与非主属性
组成候选码的属性就是主属性,其它的就是非主属性。
2、范式判断
规范化程度只要没有到达 3NF ,以下问题都会存在:
①数据冗余
②修改异常
③插入异常
④删除异常
1.第一范式(1NF)
在关系模式R中,当且仅当所有域只包含原子值,即每个属性都是不可再分的数据项,则称关系模式R是第一范式。
2.第二范式(2NF)
当且仅当关系模式R是第一范式(1NF),且每一个非主属性完全依赖候选键(没有不完全依赖)时,则称关系模式R是第二范式。
单属性候选键,至少满足2NF。
3.第三范式(3NF)
当且仅当关系模式R是第二范式(2NF),且R中没有非主属性传递依赖于候选键时,则称关系模式R是第三范式。
没有非主属性,至少满足3NF。
4.BC范式(BCNF)
设R是一个关系模式,F是它的依赖集,R属于BCNF当且仅当其F中每个依赖的决定因素必定包含R的某个候选码。
3、模式分解
1.保持函数依赖分解(冗余函数依赖不需要保留)
设数据库模式ρ={R1,R2,…,Rk}是关系模式R的一个分解,F是R上的函数依赖集,ρ中每个模式Ri上的FD集是Fi。如果{F1,F2,…,Fk}与F是等价的(即相互逻辑蕴涵),那么称分解ρ保持FD。
2.无损分解
什么是有损,什么又是无损?
有损:不能还原。 无损:可以还原。
无损连接分解:指将一个关系模式分解成若干个关系模式后,通过自然连接(自然连接和投影操作,不能进行选择操作)等运算仍能还原到原来的关系模式。
判断是否满足无损分解的方法:
1.表格法
将一个具有函数依赖:学号→姓名,课程号→课程名,(学号,课程号)→分数的关系模式:成绩(学号,姓名,课程号,课程名,分数),分解为:成绩(学号,课程号,分数);学生(学号,姓名);课程(课程号,课程名)。
2.公式法(仅适用于分解为两个子模式的)
定理:如果R的分解为ρ={ R,R},F为R所满足的函数依赖集合,分解ρ具有无损连接性的充分必要条件是:
R1∩R2 → (R1-R2)
或R1∩R2 → (R2-R1)
其中,R1∩R2表示模式的交,为R1与R2中公共属性组成,R1-R2或R2-R1表示模式的差集,R1-R2表示R1中去除R1和R2的公共属性所组成。当模式R分解成两个关系模式R1和R2时,如果R1与R2的公共属性能函数决定R1中或R2中的其它属性,这样的分解就具有无损连接性。
R1∩R2=A
R1 -R2=B,R2 -R1=C
只要满足A→B,或A→C任意一个,即为无损
满足A→B,则ρ1为无损的
R1∩R3=B
R1 -R3=A,R3 -R1=C
只要满足B→A,或B→C任意一个,即为无损
都不满足,则ρ2为有损的
三、SQL语言
1、普通查询
2、分组查询
3、权限控制
四、并发控制
1、事务的特性
①原子性(Atomicity):事务是原子的,要么做,要么都不做。
②一致性(Consistency):事务执行的结果必须保证数据库从一个一致性状态变到另一个一致性状态。
③隔离性(lsolation):事务相互隔离。当多个事务并发执行时,任一事务的更新操作直到其成功提交的整个过程,对其他事物都是不可见的。
④持久性(Durability) :一旦事务成功提交,即使数据库崩溃,其对数据库的更新操作也永久有效。
2、并发问题(十次左右考试都未出现过,了解即可)
- 丢失更新
注:在这两个事务中,T1执行的结果为5,T2执行的结果为2,我们想要得到的是A减去5再减去8的结果,但最终结果为2,因为下一个执行的事务结果会覆盖上一个事务执行的结果
- 不可重复读
注:在T1运算中,求A与B的和时,为了提高准确率,程序会再次进行验算,但在第一次运算和第二次运算的间隙,将进行T2运算,T2事务对数据进行了修改,导致验算不正确
- 读 “脏” 数据
注:值70是计算过程产生的数据,属于临时数据,该数据被恢复为了20,使得T2操作将会出错
3、封锁协议
共享锁/S锁/读锁:若事务T对数据对象A加上S锁,其他事务只能对A再加S锁,不能再对A添加X锁。
排他锁/独占锁/X锁/写锁:若事务T对数据对象A加上X锁,其他事务不能再对A添加任意锁。