第十一章 并发控制
- 多用户数据库系统
允许多个用户同时使用的数据库系统
-
- 飞机定票数据库系统
- 银行数据库系统
- 特点:在同一时刻并发运行的事务数可达数百上千个
- 多事务执行方式
(1)事务串行执行
-
- 每个时刻只有一个事务运行,其他事务必须等到这个事务结束以后方能运行
- 不能充分利用系统资源,发挥数据库共享资源的特点
(2)交叉并发方式(Interleaved Concurrency)
-
- 在单处理机系统中,事务的并行执行是这些并行事务的并行操作轮流交叉运行
- 单处理机系统中的并行事务并没有真正地并行运行,但能够减少处理机的空闲时间,提高系统的效率
(3)同时并发方式(simultaneous concurrency)
-
- 多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行
- 最理想的并发方式,但受制于硬件环境
- 更复杂的并发方式机制
- 本章讨论的数据库系统并发控制技术是以单处理机系统为基础的
- 事务并发执行带来的问题
- 会产生多个事务同时存取同一数据的情况
- 可能会存取和存储不正确的数据,破坏事务隔离性和数据库的一致性
- 数据库管理系统必须提供并发控制机制
- 并发控制机制是衡量一个数据库管理系统性能的重要标志之一
11.1 并发控制概述
- 事务是并发控制的基本单位
- 并发控制机制的任务
- 对并发操作进行正确调度
- 保证事务的隔离性
- 保证数据库的一致性
- 这种情况称为数据库的不一致性,是由并发操作引起的。
- 在并发操作情况下,对T1、T2两个事务的操作序列的调度是随机的。
- 若按上面的调度序列执行,T1事务的修改就被丢失。
- 原因:第4步中T2事务修改A并写回后覆盖了T1事务的修改
- 并发操作带来的数据不一致性
1.丢失修改(Lost Update)
2.不可重复读(Non-repeatable Read)
3.读“脏”数据(Dirty Read)
- 记号
- R(x):读数据x
W(x):写数据x
- 两个事务T1和T2读入同一数据并修改,T2的提交结果破坏了T1提交的结果,导致T1的修改被丢失。
- 上面飞机订票例子就属此类
- 不可重复读是指事务T1读取数据后,事务T2
执行更新操作,使T1无法再现前一次读取结果。
- 不可重复读包括三种情况:
(1)事务T1读取某一数据后,事务T2对其做了修改,当事务T1再次读该数据时,得到与前一次不同的值
- T1读取B=100进行运算
- T2读取同一数据B,对其进行修改后将B=200写回数据库。
- T1为了对读取值校对重读B,B已为200,与第一次读取值不一致
(2)事务T1按一定条件从数据库中读取了某些数据记录后,事务T2删除了其中部分记录,当T1再次按相同条件读取数据时,发现某些记录神秘地消失了。
(3)事务T1按一定条件从数据库中读取某些数据记录后,事务T2插入了一些记录,当T1再次按相同条件读取数据时,发现多了一些记录。
- 后两种不可重复读有时也称为幻影现象(Phantom Row)
读“脏”数据是指:
-
- 事务T1修改某一数据,并将其写回磁盘
- 事务T2读取同一数据后,T1由于某种原因被撤销
- 这时T1已修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致
- T2读到的数据就为“脏”数据,即不正确的数据
- 数据不一致性:由于并发操作破坏了事务的隔离性
- 并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性
- 对数据库的应用有时允许某些不一致性,例如有些统计工作涉及数据量很大,读到一些“脏”数据对统计精度没什么影响,可以降低对一致性的要求以减少系统开销
- 并发控制的主要技术
- 封锁(Locking)
- 时间戳(Timestamp)
- 乐观控制法
- 多版本并发控制(MVCC)
11.2 封锁
- 什么是封锁
- 基本封锁类型
- 锁的相容矩阵
- 封锁就是事务T在对某个数据对象(例如表、记录等)操作之前,先向系统发出请求,对其加锁
- 加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其它的事务不能更新此数据对象。
- 封锁是实现并发控制的一个非常重要的技术
- 一个事务对某个数据对象加锁后究竟拥有什么样的控制由封锁的类型决定。
- 基本封锁类型
- 排它锁(Exclusive Locks,简记为X锁)
- 共享锁(Share Locks,简记为S锁)
- 排它锁又称为写锁
- 若事务T对数据对象A加上X锁,则只允许T读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T释放A上的锁
- 保证其他事务在T释放A上的锁之前不能再读取和修改A
- 共享锁又称为读锁
- 若事务T对数据对象A加上S锁,则事务T可以读A但不能修改A,其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁
- 保证其他事务可以读A,但在T释放A上的S锁之前不能对A做任何修改
11.3 封锁协议
- 什么是封锁协议
- 在运用X锁和S锁对数据对象加锁时,需要约定一些规则,这些规则为封锁协议(Locking Protocol)。
- 何时申请X锁或S锁
- 持锁时间
- 何时释放
- 对封锁方式规定不同的规则,就形成了各种不同的封锁协议,它们分别在不同的程度上为并发操作的正确调度提供一定的保证。
- 在运用X锁和S锁对数据对象加锁时,需要约定一些规则,这些规则为封锁协议(Locking Protocol)。
- 三级封锁协议
1.一级封锁协议
2.二级封锁协议
3.三级封锁协议
- 一级封锁协议
- 事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。
- 正常结束(COMMIT)
- 非正常结束(ROLLBACK)
- 事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。
- 一级封锁协议可防止丢失修改,并保证事务T是可恢复的。
- 在一级封锁协议中,如果仅仅是读数据不对其进行修改,是不需要加锁的,所以它不能保证可重复读和不读“脏”数据。
- 二级封锁协议
- 一级封锁协议加上事务T在读取数据R之前必须先对其
加S锁,读完后即可释放S锁。
- 二级封锁协议可以防止丢失修改和读“脏”数据。
- 在二级封锁协议中,由于读完数据后即可释放S锁,所以它不能保证可重复读。
- 三级封锁协议
- 一级封锁协议加上事务T在读取数据R之前必须先对其加S锁,直到事务结束才释放。
- 三级封锁协议可防止丢失修改、读脏数据和不可重复读。
- 三级协议的主要区别
- 什么操作需要申请封锁以及何时释放锁(即持锁时间)
- 不同的封锁协议使事务达到的一致性级别不同
- 封锁协议级别越高,一致性程度越高