教材为数据库系统概论第五版(王珊)
多用户数据库系统是指允许多个用户同时使用的数据库系统其特点是在同一时刻并发运行的事务数可达数百上千个,多用户数据库系统涉及并行控制。
多事务执行方式
1.事务串行执行
- 每个时刻只有一个事务运行,其他事务必须等到这个事务结束以后方能运行
- 不能充分利用系统资源,发挥数据库共享资源的特点
2.交叉并发方式(interleaved concurrency)
- 事务的并行执行是这些并行事务的并行操作轮流交叉运行
- 是单处理机系统中的并发方式,能够减少处理机的空闲时间,提高系统的效率
3.同时并发方式(simultaneous concurrency)
- 多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行
- 最理想的并发方式,但受制于硬件环境
- 更复杂的并发方式机制
事务并发执行带来的问题
- 可能会存取和存储不正确的数据,破坏事务的隔离性和数据库的一致性
- DBMS必须提供并发控制机制
- 并发控制机制是衡量一个DBMS性能的重要标志之一
11.1 并发控制概述
并发控制机制的任务
- 对并发操作进行正确调度
- 保证事务的隔离性
- 保证数据库的一致性
并发操作带来的数据不一致性(背一下,更要理解)
- 丢失修改(lost update)
- 不可重复读(non-repeatable read)
- 读“脏”数据(dirty read)
1.丢失修改
丢失修改是指事务1与事务2从数据库中读入同一数据并修改
事务2的提交结果破坏了事务1提交的结果,导致事务1的修改被丢失。
2.不可重复读
不可重复读是指事务1读取数据后,事务2执行更新操作,使事务1无法再现前一次读取结果。
三类不可重复读
事务1读取某一数据后:
- 事务2对其做了修改,当事务1再次读该数据时,得到与前一次不同的值。(上图)
- 事务2删除了其中部分记录,当事务1再次读取数据时,发现某些记录神密地消失了。
- 事务2插入了一些记录,当事务1再次按相同条件读取数据时,发现多了一些记录。
后两种不可重复读有时也称为幻影现象(phantom row)
3.读“脏”数据
事务1修改某一数据,并将其写回磁盘。事务2读取同一数据后。事务1由于某种原因被撤消,这时事务1已修改过的数据恢复原值。事务2读到的数据就与数据库中的数据不一致,
是不正确的数据,又称为“脏”数据。
产生上述三类数据不一致性的主要原因是并发操作破坏了事务的隔离性。并发控制机制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性。
并发控制的主要技术有封锁(locking)、时间戳(timestamp)、乐观控制法(optimisticscheduler)和多版本并发控制(multi-version concurrency control,MVCC)等。
11.2 封锁
一、什么是封锁
封锁就是事务T在对某个数据对象(例如表、记录等)操作之前,先向系统发出请求,对其加锁
- 加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其它的事务不能更新此数据对象。
- 封锁是实现并发控制的一个非常重要的技术
二、基本封锁类型
DBMS通常提供了多种类型的封锁。一个事务对某个数据对象加锁后究竟拥有什么样的控制是由封锁的类型决定的。
基本封锁类型
- 排它锁(eXclusive lock,简记为X锁)
- 共享锁(Share lock,简记为S锁)
排它锁
- 排他锁又称为写锁
- 若事务T对数据对象A加上X锁,则只允许T读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T释放A上的锁
共享锁
- 共享锁又称为读锁
- 若事务T对数据对象A加上S锁,则其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁
三、基本锁的相容矩阵
封锁类型相容矩阵中,最左边一列表示事务T1已经获得的数据对象上的锁的类型,其中横线表示没有加锁。最上面一行表示另一事务T2对同一数据对象发出的封锁请求。T2的封锁请求能否被满足用矩阵中的Y和N表示,其中Y表示事务T2的封锁要求与T1已持有的锁相容,封锁请求可以满足。N表示T2的封锁请求与T1已持有的锁冲突,T2的请求被拒绝。
11.3 封锁协议
在运用X锁和S锁对数据对象加锁时,需要约定一些规则:封锁协议(Locking Protocol)
比如:
- 何时申请X锁或S锁
- 持锁时间、何时释放
不同的封锁协议,在不同的程度上为并发操作的正确调度提供一定的保证
常用的封锁协议:三级封锁协议
1.一级封锁协议
事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。事务结束包括正常结束(COMMIT)和非正常结束(ROLLBACK)
作用:
- 1级封锁协议可防止丢失修改
- 在1级封锁协议中,如果是读数据,不需要加锁的,所以它不能保证可重复读和不读“脏”数据。
例:
2.二级封锁协议
1级封锁协议+事务T在读取数据R前必须先加S锁,读完后即可释放S锁
作用:
- 2级封锁协议可以防止丢失修改和读“脏”数据
- 在2级封锁协议中,由于读完数据后即可释放S锁,所以它不能保证可重复读
3.三级封锁协议
1级封锁协议 + 事务T在读取数据R之前必须先对其加S锁,直到事务结束才释放
作用:
- 3级封锁协议可防止丢失修改、读脏数据和不可重复读
三级协议的主要区别
- 什么操作需要申请封锁
- 何时释放锁(即持锁时间)
11.4 活锁和死锁
11.4.1 活锁
如果事务T1封锁了数据R,事务T2,又请求封锁R,于是T2等待;T3也请求封锁R,当T1释放了R上的封锁之后系统首先批准了T3的请求,T2仍然等待;然后T4又请求封锁R,当T3释放了R上的封锁之后系统又批准了T4的请求……T2有可能永远等待,这就是活锁的情形
如何避免活锁
- 采用先来先服务的策略:当多个事务请求封锁同一数据对象,按请求封锁的先后次序对这些事务排队。该数据对象上的锁一旦释放,首先批准申请队列中第一个事务获得锁。
11.4.2 死锁
如果事务T1封锁了数据R1,T2封锁了数据R2,然后T1又请求封锁R2,因T2已封锁了R2,于是T1等待T2释放R2上的锁;接着T1又申请封锁R1,因T已封锁了R1,T2也只能等待T1释放R1上的锁。这样就出现了T1在等待T2,而T2又在等待T1的局面,T1和T2两个事务永远不能结束,形成死锁。
解决死锁的方法
-
预防死锁
-
死锁的诊断与解除
1. 死锁的预防
- 产生死锁的原因是两个或多个事务都已封锁了一些数据对象,然后又都请求对已为其他事务封锁的数据对象加锁,从而出现死等待。
- 预防死锁的发生就是要破坏产生死锁的条件
预防死锁的方法
- 一次封锁法
- 顺序封锁法
(1)一次封锁法
- 要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行
- 一次封锁法存在的问题:
- 降低并发度
- 扩大封锁范围
- 将以后要用到的全部数据加锁,势必扩大了封锁的范围,从而降低了系统的并发度
- 难于事先精确确定封锁对象
- 数据库中数据是不断变化的,原来不要求封锁的数据,在执行过程中可能会变成封锁对象,所以很难事先精确地确定每个事务所要封锁的数据对象
- 解决方法:将事务在执行过程中可能要封锁的数据对象全部加锁,这就进一步降低了并发度。
- 降低并发度
(2)顺序封锁法
顺序封锁法是预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁。
顺序封锁法存在的问题
- 维护成本高
- 数据库系统中可封锁的数据对象极其众多,并且随数据的插入、删除等操作而不断地变化,要维护这样极多而且变化的资源的封锁顺序非常困难,成本很高
- 难于实现
结论
- 在操作系统中广为采用的预防死锁的策略并不很适合数据库的特点
- DBMS在解决死锁的问题上更普遍采用的是诊断并解除死锁的方法
- 死锁的诊断与解除
1.检测死锁:超时法
- 如果一个事务的等待时间超过了规定的时限,就认为发生了死锁
优点:实现简单
缺点
- 有可能误判死锁
- 时限若设置得太长,死锁发生后不能及时发现
2.等待图法
用事务等待图动态反映所有事务的等待情况
- 事务等待图是一个有向图G=(T,U)
- T为结点的集合,每个结点表示正运行的事务
- U为边的集合,每条边表示事务等待的情况
- 若T1等待T2,则T1,T2之间划一条有向边,从T1指向T2
例:
(a)表示事务T1等待T2,T2又等待T1,产生了死锁
并发控制子系统周期性地(比如每隔1 min)检测事务等待图,如果发现图中存在回路,则表示系统中出现了死锁
解除死锁:
- 选择一个处理死锁代价最小的事务,将其撤消,释放此事务持有的所有的锁,使其它事务能继续运行下去
11.5 并发调度的可串行性
11.5.1 可串行化调度
可串行化(Serializable)的调度:几个事务的并行执行是正确的,当且仅当其结果与按某一次序串行地执行它们时的结果相同
可串行性(serializability):并发事务正确调度的准则。按这个准则规定,一个给定的并发调度,当且仅当它是可串行化的,才认为是正确调度。
例:
现在有两个事务,分别包含下列操作:
- 事务1:读B;A=B+1;写回A;
- 事务2:读A;B=A+1;写回B;
假设A的初值为2,B的初值为2。
(a) 串行调度策略,正确的调度(先执行T1)
(b) 串行调度策略,正确的调度(先执行T2)
© 不可串行化的调度
由于其执行结果与(a)、(b)的结果都不同,所以是错误的调度
(d) 可串行化的调度
由于其执行结果与串行调度(a)的执行结果相同,所以是正确的调度
11.5.2 冲突可串行化调度
冲突操作:不同的事务对同一个数据的读写操作和写写操作:
- Ri(x)与Wj(x)
事务T读x,T写x,其中i≠j
- Wi(x)与Wj(X)
事务T写x,T写x,其中i≠j
其他操作是不冲突操作。
- 不同事务的冲突操作和同一事务的两个操作是不能交换(swap)的
一个调度Sc在保证冲突操作的次序不变的情况下,通过交换两个事务不冲突操作的次序得到另一个调度Sc’,如果Sc’是串行的,称调度Sc为冲突可串行化的调度。若一个调度是冲突可串行化,则一定是可串行化的调度。因此可以用这种方法来判断一个调度是否是冲突可串行化的。
冲突可串行化调度是可串行化调度的充分条件,不是必要条件。
看看书上p316页的例题加以理解
11.6 两段锁协议
两段锁协议的内容:
-
在对任何数据进行读、写操作之前,事务首先要获得对该数据的封锁
-
在释放一个封锁之后,事务不再获得任何其他封锁。
“两段”锁的含义:事务分为两个阶段
- 第一阶段是获得封锁,也称为扩展阶段;
- 第二阶段是释放封锁,也称为收缩阶段
例:
-
并行执行的所有事务均遵守两段锁协议,则对这些事务的所有并行调度策略都是可串行化的
-
所有遵守两段锁协议的事务,其并行执行的结果一定是正确的
-
可串行化的调度中,不一定所有事务都必须符合两段锁协议
两段锁协议与防止死锁的一次封锁法比较:
- 一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行,因此一次封锁法遵守两段锁协议
- 但是两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁,因此遵守两段锁协议的事务可能发生死锁
两段锁协议与三级封锁协议比较:
- 两类不同目的的协议
- 两段锁协议:保证并发调度的正确性
- 三级封锁协议:在不同程度上保证数据一致性
- 遵守第三级封锁协议必然遵守两段协议
11.7 封锁的粒度
一、什么是封锁粒度
封锁对象的大小称为封锁的粒度(Granularity)
封锁的对象:逻辑单元,物理单元
- 逻辑单元: 属性值、属性值集合、元组、关系、索引项、整个索引、整个数据库等
- 物理单元:页(数据页或索引页)、物理记录等
多粒度封锁(multiple granularity locking):在一个系统中同时支持多种封锁粒度供不同的事务选择
11.7.1 多粒度封锁
选择封锁粒度的原则:考虑开销和并发
多粒度树:以树形结构来表示多级封锁粒度
- 根结点是整个数据库,表示最大的数据粒度
- 叶结点表示最小的数据粒度
例:
三级粒度树。根结点为数据库,数据库的子结点为关系,关系的子结点为元组
多粒度封锁协议:
- 允许多粒度树中的每个结点被独立地加锁
- 对一个结点加锁意味着这个结点的所有后裔结点也被加以同样类型的锁
- 在多粒度封锁中一个数据对象可能以两种方式封锁:显式封锁和隐式封锁
- 显式封锁: 直接加到数据对象上的封锁
- 隐式封锁: 由于其上级结点加锁而使该数据对象加上了锁
显式封锁和隐式封锁的效果是一样的
对某个数据对象加锁时系统检查的内容:
- 该数据对象:有无显式封锁与之冲突
- 所有上级结点:检查本事务的显式封锁是否与该数据对象上的隐式封锁冲突:(由上级结点封锁造成的)
- 所有下级结点:看上面的显式封锁是否与本事务的隐式封锁(将加到下级结点的封锁)冲突。
11.7.2 意向锁
引进意向锁(intention lock)目的:提高对某个数据对象加锁时系统的检查效率
意向锁:对任一结点加基本锁,必须先对它的上层结点加意向锁。如果对一个结点加意向锁,则说明该结点的下层结点正在被加锁
意向锁:
- 意向共享锁(Intent Share Lock,简称IS锁)
- 意向排它锁(Intent Exclusive Lock,简称IX锁)
- 共享意向排它锁(Share Intent Exclusive Lock,简称SIX锁)
IS锁:如果对一个数据对象加IS锁,表示它的后裔结点拟(意向)加S锁
例:要对某个元组加S锁,则要首先对关系和数据库加IS锁
IX锁:如果对一个数据对象加IX锁,表示它的后裔结点拟(意向)加X锁。
例:要对某个元组加X锁,则要首先对关系和数据库加IX锁
SIX锁:如果对一个数据对象加SIX锁,表示对它加S锁,再加IX锁,即SIX = S + IX
例:对某个表加SIX锁,则表示该事务要读整个表(所以要对该表加S锁),同时会更新个别元组(所以要对该表加IX锁)
意向锁的相容矩阵
锁的强度:锁的强度是指它对其他锁的排斥程度。一个事务在申请封锁时以强锁代替弱锁是安全的,反之则不然
锁强度偏序关系:
具有意向锁的多粒度封锁方法:
- 申请封锁时应该按自上而下的次序进行;
- 释放封锁时则应该按自下而上的次序进行
例:事务T要对一个数据对象加锁,必须先对它的上层结点加意向锁
课后习题:
http://t.csdn.cn/iqIqL