并发控制——概述及并发控制调度

什么是数据库并发访问

  • 对多用户并发存取同一数据的操作不加控制可能会存取和存储不正确的数据
  • DBMS必须提供并发控制机制
  • 事务是并发控制和恢复的基本单位

事务

  • 概念
    • 从用户的观点看,对数据库的某些操作应是一个整体,也就是一个独立的工作单元,不可分割
    • 例子:电子资金转账(从账号A转一笔钱到账号B)客户可能认为是一个独立的操作,而DBS中是由几个操作组成的
  • 定义
    • 事务是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位
    • 事务和程序是两个概念
      • 在关系数据库中,一个事务可以是一条SQL语句,一组SQL语句或整个程序
      • 一个应用程序通常包含多个事务
    • 事务是恢复和并发控制的基本单位
  • 定义事务的两种方式
    • 显式方式
      • 事务的开始由用户显式控制或DBMS自动隐含
      • 事务结束由用户显式控制
    • 隐式方式
      • 当用户没有显式地定义事务时,有DBMS按缺省规定自动划分事务
  • 显式定义事务
    BEGIN TRANSACTION ←—— 事务开始
        SQL语句1
        SQL语句2
        ......
        COMMIT ←—— 事务结束
    
    
    
    BEGIN TRANSACTION ←—— 事务开始
        SQL语句1
        SQL语句2
        ......
        ROLLBACK ←—— 事务结束
  • 事务结束语句
    • COMMIT
      • 事务正常结束
      • 提交事务的所有操作(读+更新)
      • 事务中所有对数据库的更新永久生效
    • ROLLBACK
      • 事务异常终止
      • 事务运行的过程中发生了故障,不能继续执行,回滚事务的所有更新操作
      • 事务回滚到开始时的状态
  • ACID特性
    • 原子性(Atomicity)
      • 事务是数据库的逻辑工作单位
        • 事务中包括的诸操作要么都做,要么都不做
    • 一致性(Consistency)
      • 事务执行的结果必须是使数据库从一个一致性状态变成另一个一致性状态
        • 一致性状态:数据库中只包含成功事务提交的结果
        • 不一致状态:数据库中包含失败事务的结果
      • 一致性与原子性是密切相关的
        例子:银行转账:从账号A中取出一万元,存入账号B
        定义一个事务,该事务包括两个操作
               第一个操作是从账号A中减去一万元
               第二个操作是向账号B中加入一万元
        这两个操作要么全做,要么全不做
                全做或者全不做,数据库都处于一致性状态
                如果只做一个操作则用户逻辑上就会发生错误,少了一万元,这时数据库就处于不一致性状态
    • 隔离性(Isolation)
      • 一个事务的执行不能被其它事务干扰
        • 一个事务内部的操作及使用的数据对其它并发事务是隔离的
        • 并发执行的各个事务之间不能互相干扰
    • 持续性(Durability)
      • 持续性也称为永久性
        • ​​​​​​​一个事务一单提交,它对数据库中数据的改变就应该是永久性的
        • 接下来的其它操作或故障不应该对其执行结果有任何影响
    • 保证事务ACID特性是事务处理的重要任务
    • 破坏事务ACID特性的因素
      • ​​​​​​​多个事务并行运行时,不同事务的操作交叉执行
        • DBMS必须保证多个事务的交叉运行不影响这些事务ACID特性,特别是原子性隔离性
      • 事务在运行过程中被强行停止
        • DBMS必须保证被强行终止的事务对数据库和其它事务没有任何影响
  • 多事务执行方式
    • 事务串行执行
      • 每个时刻只有一个事务运行,其它事务必须等到这个事务结束以后方能运行
      • 不能充分利用系统资源,发挥数据库共享资源的特点
    • 交叉并发方式
      • 事务的并行执行是这些并行事务的并行操作轮流交叉运行
      • 单处理机系统中的并发方式,能够减少处理机的空闲时间,提高系统的效率
    • 同时并发方式
      • 多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行
      • 最理想的并发方式,但受制于硬件环境
  • 事务并发执行带来的问题
    • 对多用户并发存取同一数据的操作不加控制可能会存取和存储不正确的数据,破坏事务的隔离性和数据库的一致性
    • DBMS必须提供并发控制机制
    • 并发控制机制是衡量一个DBMS性能的重要标志之一

并发操作与数据的不一致性

产生原因:
①由两个事务并发操作引起
②在并发操作情况下,对T_{1}T_{2}两个事务的操作序列的调度是随机的
③若按上面的调度序列执行,T_{1}事务修改就被丢弃
④因为第四步中T_{2}事务修改A并写回后覆盖了T_{1}事务的修改

  • 并发操作带来的数据不一致性
    • 丢失修改

    • 不可重复读
      • 读-更新
        • 事务1读取某一数据
        • 事务2对其做了修改
        • 当事务1再次读该数据时,得到了与前一次不同的值
      • 读-删除
        • 事务1按一定条件从数据库中读取某些数据记录
        • 事务2删除了其中部分记录
        • 当事务1再次按相同条件读取数据时,发现某些记录神秘消失
      • 读-插入
        • 事务1按一定条件从数据库中读取某些数据记录
        • 事务2插入了一些记录
        • 当事务1再次按相同条件读取数据时,发现多了一些记录
    • 读“脏”数据

并发操作的调度

  • 计算机系统对并行事务中并行操作的调度是随机中,而不同的调度可能会产生不同的结果
  • 将所有事务串行起来的调度策略一定是正确的调度策略
    • 如果一个事务运行过程中没有其他事务在同时运行,也就是说它没有受到其他事务的干扰,那么就可以认为该事务的运行结果是正常的或者是预想的

可串行化的调度

  • 以不同的顺序串行执行事务也有可能会产生不同的结果但由于不会将数据库置于不一致状态,所有都可以认为是正确
  • 几个事务的并行执行是正确的
    • 当且仅当其结果与按某一次序串行地执行它们时的结果相同。这种并行调度策略称为可串行化的调度
  • 可串行性是并行事务正确性的唯一准则
    例:现在有两个事务,分别包含下列操作:
    事务1:读B;A=B+1;写回A;
    事务2:读A;B=A+1;写回B;
    假设A的初值为2,B的初值为2。
    A
    串行调度策略
    B
    串行调度策略
    C
    由于其执行结果与(a)、(b)的结果都不同,所以是错误的调度。
    不可串行化的调度
    D
    由于其执行结果与串行调度(a)的执行结果相同,所以是正确的调度。
    可串行化的调度
    ​​​

可串行化的调度策略

  • 为了保证并行操作的正确性,DBMS的并行控制机制必须提供一定的手段来保证调度是可串行化
  • 从理论上讲,在某一事务执行时禁止其他事务执行的调度策略一定是可串行化的调度,这也是最简单的调度策略
  • 但这种方法实际上是不可行的,因为它使用户不能充分共享数据库资源

练习题

保证并发操作调度正确性的方法

  • 封锁方法

    • 两段锁(2PL)协议

  • 时标方法

  • 乐观方法

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值