什么是数据库并发访问
- 对多用户并发存取同一数据的操作不加控制可能会存取和存储不正确的数据
- DBMS必须提供并发控制机制
- 事务是并发控制和恢复的基本单位
事务
- 概念
- 从用户的观点看,对数据库的某些操作应是一个整体,也就是一个独立的工作单元,不可分割
- 例子:电子资金转账(从账号A转一笔钱到账号B)客户可能认为是一个独立的操作,而DBS中是由几个操作组成的
- 定义
- 事务是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位
- 事务和程序是两个概念
- 在关系数据库中,一个事务可以是一条SQL语句,一组SQL语句或整个程序
- 一个应用程序通常包含多个事务
- 事务是恢复和并发控制的基本单位
- 定义事务的两种方式
- 显式方式
- 事务的开始由用户显式控制或DBMS自动隐含
- 事务结束由用户显式控制
- 隐式方式
- 当用户没有显式地定义事务时,有DBMS按缺省规定自动划分事务
- 显式方式
- 显式定义事务
BEGIN TRANSACTION ←—— 事务开始 SQL语句1 SQL语句2 ...... COMMIT ←—— 事务结束 BEGIN TRANSACTION ←—— 事务开始 SQL语句1 SQL语句2 ...... ROLLBACK ←—— 事务结束
- 事务结束语句
- COMMIT
- 事务正常结束
- 提交事务的所有操作(读+更新)
- 事务中所有对数据库的更新永久生效
- ROLLBACK
- 事务异常终止
- 事务运行的过程中发生了故障,不能继续执行,回滚事务的所有更新操作
- 事务回滚到开始时的状态
- COMMIT
- ACID特性
- 原子性(Atomicity)
- 事务是数据库的逻辑工作单位
- 事务中包括的诸操作要么都做,要么都不做
- 事务是数据库的逻辑工作单位
- 一致性(Consistency)
- 事务执行的结果必须是使数据库从一个一致性状态变成另一个一致性状态
- 一致性状态:数据库中只包含成功事务提交的结果
- 不一致状态:数据库中包含失败事务的结果
- 一致性与原子性是密切相关的
例子:银行转账:从账号A中取出一万元,存入账号B
定义一个事务,该事务包括两个操作
第一个操作是从账号A中减去一万元
第二个操作是向账号B中加入一万元
这两个操作要么全做,要么全不做
全做或者全不做,数据库都处于一致性状态
如果只做一个操作则用户逻辑上就会发生错误,少了一万元,这时数据库就处于不一致性状态
- 事务执行的结果必须是使数据库从一个一致性状态变成另一个一致性状态
- 隔离性(Isolation)
- 一个事务的执行不能被其它事务干扰
- 一个事务内部的操作及使用的数据对其它并发事务是隔离的
- 并发执行的各个事务之间不能互相干扰
- 一个事务的执行不能被其它事务干扰
- 持续性(Durability)
- 持续性也称为永久性
- 一个事务一单提交,它对数据库中数据的改变就应该是永久性的
- 接下来的其它操作或故障不应该对其执行结果有任何影响
- 持续性也称为永久性
- 保证事务ACID特性是事务处理的重要任务
- 破坏事务ACID特性的因素
- 多个事务并行运行时,不同事务的操作交叉执行
- DBMS必须保证多个事务的交叉运行不影响这些事务ACID特性,特别是原子性和隔离性
- 事务在运行过程中被强行停止
- DBMS必须保证被强行终止的事务对数据库和其它事务没有任何影响
- 多个事务并行运行时,不同事务的操作交叉执行
- 原子性(Atomicity)
- 多事务执行方式
- 事务串行执行
- 每个时刻只有一个事务运行,其它事务必须等到这个事务结束以后方能运行
- 不能充分利用系统资源,发挥数据库共享资源的特点
- 交叉并发方式
- 事务的并行执行是这些并行事务的并行操作轮流交叉运行
- 是单处理机系统中的并发方式,能够减少处理机的空闲时间,提高系统的效率
- 同时并发方式
- 多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行
- 最理想的并发方式,但受制于硬件环境
- 事务串行执行
- 事务并发执行带来的问题
- 对多用户并发存取同一数据的操作不加控制可能会存取和存储不正确的数据,破坏事务的隔离性和数据库的一致性
- DBMS必须提供并发控制机制
- 并发控制机制是衡量一个DBMS性能的重要标志之一
并发操作与数据的不一致性
产生原因:
①由两个事务并发操作引起
②在并发操作情况下,对、
两个事务的操作序列的调度是随机的
③若按上面的调度序列执行,事务修改就被丢弃
④因为第四步中事务修改A并写回后覆盖了
事务的修改
- 并发操作带来的数据不一致性
- 丢失修改
- 不可重复读
- 读-更新
- 事务1读取某一数据
- 事务2对其做了修改
- 当事务1再次读该数据时,得到了与前一次不同的值
- 读-删除
- 事务1按一定条件从数据库中读取某些数据记录
- 事务2删除了其中部分记录
- 当事务1再次按相同条件读取数据时,发现某些记录神秘消失
- 读-插入
- 事务1按一定条件从数据库中读取某些数据记录
- 事务2插入了一些记录
- 当事务1再次按相同条件读取数据时,发现多了一些记录
- 读-更新
- 读“脏”数据
- 丢失修改
并发操作的调度
- 计算机系统对并行事务中并行操作的调度是随机中,而不同的调度可能会产生不同的结果
- 将所有事务串行起来的调度策略一定是正确的调度策略
- 如果一个事务运行过程中没有其他事务在同时运行,也就是说它没有受到其他事务的干扰,那么就可以认为该事务的运行结果是正常的或者是预想的
可串行化的调度
- 以不同的顺序串行执行事务也有可能会产生不同的结果但由于不会将数据库置于不一致状态,所有都可以认为是正确的
- 几个事务的并行执行是正确的
- 当且仅当其结果与按某一次序串行地执行它们时的结果相同。这种并行调度策略称为可串行化的调度
- 可串行性是并行事务正确性的唯一准则
例:现在有两个事务,分别包含下列操作:
事务1:读B;A=B+1;写回A;
事务2:读A;B=A+1;写回B;
假设A的初值为2,B的初值为2。
A B C
不可串行化的调度D
可串行化的调度
可串行化的调度策略
- 为了保证并行操作的正确性,DBMS的并行控制机制必须提供一定的手段来保证调度是可串行化的
- 从理论上讲,在某一事务执行时禁止其他事务执行的调度策略一定是可串行化的调度,这也是最简单的调度策略
- 但这种方法实际上是不可行的,因为它使用户不能充分共享数据库资源
练习题
| |
保证并发操作调度正确性的方法
-
封锁方法
-
两段锁(2PL)协议
-
-
时标方法
-
乐观方法