关系型数据库第七章笔记---事务处理

事务的概念

事务的定义

事务(Transaction)是用户定义的一个数据库操作序列, 这些操作要么全做,要么全不做(All or Nothing),是一个不可分割的工作单位(UOW)。

  • 事务和程序是两个概念
    • 在关系数据库中,一个事务可以是一条SQL语句,一组SQL语句或整个程序。
    • 一个程序通常包含多个事务
  • 事务是恢复和并发控制的基本单位。

定义事务

显式定义方式

事务正常结束

BEGIN TRANSACTION
SQL 语句1 
SQL 语句2
。。。。。
COMMIT
/*事务正常结束提交事务的所有操作(读+更新)
事务中所有对数据库的更新写回到磁盘上的物理数据库中*/

事务异常终止

BEGIN TRANSACTION
SQL 语句1 
SQL 语句2
。。。。。
ROLLBACK
/*事务异常终止,系统将事务全部操作撤销UNDO
事务回滚到事 务开始时的状态*/
隐式定义方式

当用户没有显式地定义事务时, 数据库管理系统按缺省规定自动

事务结束

  • COMMIT
    • 事务正常结束。
    • 提交事务的所有操作(读+更新)。
    • 事务中所有对数据库的更新写回到磁盘上的物理数据库中。
  • ROLLBACK
    • 事务异常终止
    • 事务运行的过程中发生了故障,不能继续执行。
    • 系统将事务中对数据库的所有已完成的操作全部撤销。
    • 事务滚回到开始时的状态。

事务的特性

事务的ACID特性:

  • 原子性(Atomicity)
  • 一致性(Consistency)
  • 隔离性(Isolation)
  • 持续性(Durability )

1.原子性

事务是数据库的逻辑工作单位,事务中包括的诸操作要么都做,要么都不做

2.一致性

事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。
一致性状态:数据库中只包含成功事务提交的结果。

不一致状态:数据库系统运行中发生故障,有些事务尚未完成就被迫中断,这些未完成事务对数据库所做的修改有一部分已写入物理数据库,这时数据库就处于一种不正确的状态

3.隔离性

一个事务的执行不能被其他事务干扰

  • 一个事务内部的操作及使用的数据对其他并发事务是隔离的
  • 并发执行的各个事务之间不能互相干扰

4.持续性

持续性也称永久性(Permanence)

  • 一个事务一旦提交,它对数据库中数据的改变就应该 是永久性的。
  • 接下来的其他操作或故障不应该对其执行结果有任何影响。

破坏事务ACID特性的因素

  1. 多个事务并行运行时,不同事务的操作交叉执行
    • 数据库管理系统必须保证多个事务的交叉运行不影响这 些事务的隔离性。
  2. 事务在运行过程中被强行停止
    • 数据库管理系统必须保证被强行终止的事务对数据库和其他事务没有任何影响
  • 保证事务在故障发生时满足ACID性质的措施称为“恢复”技术。
  • 保证多个事务在并行执行时满足ACID性质的措施称为“并发控制”技术。
  • 恢复和并发控制是保证事务正确运行的两项基本技术,它们被合称为事务管理

事务的操作

基于简化的表达方式,可把事务涉及的基本存取操作分为以下两种

  • Read(X):从数据库中将数据对象X读入到执行read操作的事务的一个局部缓冲区中。
  • Write(X):从执行write的事务的局部缓冲区把数据对象X写入数据库

Write操作的结果可以暂时存储在内存中,DBMS的恢复子系统和底层操作系统协同控制,以决定写回磁盘的时机

事务的状态

为了在发生故障时方便恢复,系统需要对事务所处的状态进行跟踪记录,包括事务的起始、提交、撤销或终止等信息

下图所示是事务的状态转移图:

image-20210504232635930.png

SQL的事务管理

  • 在SQL中,事务的定义和前面提到的事务的概念类似,即它是一个逻辑工作单元,并且保持原子性。
  • 事务显式的结束语句可以是COMMIT或ROLLBACK,书写形式如下列SQL语句:
    • COMMIT [WORK]:提交当前事务,开始执行一个新事务。
    • ROLLBACK [WORK]:中止当前事务,撤销事务的影响

数据库恢复技术

概述

故障

  • 任何导致运行事务非正常中断,影响数据库中数据的正确性的事件都成为故障。
  • 故障破坏数据库,造成全部或部分丢失数据

故障是不可避免的

  • 计算机硬件的失效
  • 软件的错误
  • 操作员的失误
  • 恶意的破坏

数据库的恢复

数据库管理系统必须具有把数据库从错误状态恢复到某 一已知的正确状态(亦称为一致状态或完整状态)的功能, 这就是数据库的恢复管理系统对故障的对策

故障的种类

1.事务内部的故障

  • 有的是可以通过事务程序本身发现的(见下面转账事务的例子)。
  • 有的是非预期的,不能由事务程序处理的

例如,银行转账事务,这个事务把一笔金额从一个账户甲
转给另一个账户乙。

BEGIN TRANSACTION
读账户甲的余额BALANCE;
BALANCE=BALANCE-AMOUNT;		/*AMOUNT 为转账金额*/
IF(BALANCE < 0 ) 
THEN
{打印‘金额不足,不能转账’;		/*事务内部可能造成事务被回滚的情况*/
ROLLBACK;					/*撤销刚才的修改,恢复事务*/
} 
ELSE
{读账户乙的余额BALANCE1; 
BALANCE1=BALANCE1+AMOUNT; 
写回BALANCE1;
COMMIT;
}
故障的原因
  • 运算溢出
  • 并发事务发生死锁而被选中撤销该事务
  • 违反了某些完整性限制而被终止等

事务故障意味着

  • 事务没有达到预期的终点(COMMIT或者显式的ROLLBACK)。
  • 数据库可能处于不正确状态。
故障的恢复

事务撤消(UNDO)

  • 强行回滚(ROLLBACK)该事务。
  • 撤销该事务已经作出的任何对数据库的修改,使得该事务就象根本没有启动一样。

2.系统故障

系统故障称为软故障,是指造成系统停止运转的任何事件,使得系统要重新启动。

  • 整个系统的正常运行突然被破坏。
  • 所有正在运行的事务都非正常终止。
  • 不破坏数据库外存。
  • 内存中数据库缓冲区的信息全部丢失。
故障的原因
  • 特定类型的硬件错误(如CPU故障)
  • 操作系统故障
  • 数据库管理系统代码错误
  • 系统断电
故障的恢复
  • 发生系统故障时,一些尚未完成的事务的结果可能已送入物理数据库,造成数据库可能处于不正确状态。
    • 恢复策略:系统重新启动时,恢复程序让所有非正常 终止的事务回滚,强行撤消(UNDO)所有未完成事务
  • 发生系统故障时,有些已完成的事务可能有一部分甚至全部留在缓冲区,尚未写回到磁盘上的物理数据库中,系统故障使得这些事务对数据库的修改部分或全部丢失。
    • 恢复策略:系统重新启动时,恢复程序需要重做(REDO)所有已提交的事务。

3.介质故障

介质故障称为硬故障,指外存故障

故障的原因
  • 磁盘损坏
  • 磁头碰撞
  • 瞬时强磁场干扰

介质故障破坏数据库或部分数据库,并影响正在存取这部分数据的所有事务。
介质故障比前两类故障的可能性小得多,但破坏性大得多。

4.计算机病毒

计算机病毒

  • 一种人为的故障或破坏,是一些恶作剧者编写的一种计算机程序。

  • 可以繁殖和传播,造成对计算机系统包括数据库的危害。

计算机病毒种类
  • 小的病毒只有20条指令,不到50B。
  • 大的病毒像一个操作系统,由上万条指令组成
计算机病毒的危害
  • 有的病毒传播很快,一旦侵入系统就马上摧毁系统。
  • 有的病毒有较长的潜伏期,计算机在感染后数天或数月才开始发病。
  • 有的病毒感染系统所有的程序和数据。
  • 有的只对某些特定的程序和数据感兴趣

计算机病毒已成为计算机系统的主要威胁,自然也是数据库系统的主要威胁。
数据库一旦被破坏仍要用恢复技术把数据库加以恢复

故障小结

各类故障,对数据库的影响有两种可能性

  • 一是数据库本身被破坏。
  • 二是数据库没有被破坏,但数据可能不正确,这是由 于事务的运行被非正常终止造成的

恢复的实现技术

  • 恢复操作的基本原理:冗余

    • 利用存储在系统别处的冗余数据来重建数据库中已被破坏或不正确的那部分数据。
  • 恢复的实现技术:复杂

    • 一个大型数据库产品,恢复子系统的代码要占全部代码的10%以上。

数据转储

转储定义
  • 转储(dump)是指数据库管理员定期地将整个数据库复制到磁带、磁盘或其他存储介质上保存起来的过程。
  • 备用的数据文本称为后备副本(backup)或后援副本
转储方法
静态转储与动态转储
  • 静态转储
    • 在系统中无运行事务时进行的转储操作。
    • 转储开始时数据库处于一致性状态。
    • 转储期间不允许对数据库的任何存取、修改活动。
    • 得到的一定是一个数据一致性的副本。
    • 优点:实现简单。
    • 缺点:降低了数据库的可用性。
      • 转储必须等待正运行的用户事务结束。
      • 新的事务必须等转储结束。
  • 动态转储
    • 转储操作与用户事务并发进行。
    • 转储期间允许对数据库进行存取或修改。
    • 优点
      • 不用等待正在运行的用户事务结束。
      • 不会影响新事务的运行。
    • 动态转储的缺点
      • 不能保证副本中的数据正确有效。
      • 例在转储期间的某时刻Tc,系统把数据A=100转储到磁带上,而在下一时刻Td,某一事务将A改为200。后备副本上的A过时了。
    • 利用动态转储得到的副本进行故障恢复
      • 需要把动态转储期间各事务对数据库的修改活动登记下来,建立日志文件。
      • 后备副本加上日志文件就能把数据库恢复到某一时刻的正确状态。
海量转储与增量转储
  • 海量转储: 每次转储全部数据库
  • 增量转储: 只转储上次转储后更新过的数据
  • 海量转储与增量转储比较
    • 从恢复角度看,使用海量转储得到的后备副本进行恢 复往往更方便。
    • 如果数据库很大,事务处理又十分频繁,则增量转储方式更实用更有效。
转储方法小结

转储方法分类

  • 动态增量转储
  • 动态海量转储
  • 静态增量转储
  • 静态海量转储

登记日志文件

日志文件的格式和内容

日志文件(log file)是用来记录事务对数据库的更新操作的文件

  • 日志文件的格式
    • 以记录为单位的日志文件。
      • 各个事务的开始标记(BEGIN TRANSACTION)。
      • 各个事务的结束标记(COMMIT或ROLLBACK)。
      • 各个事务的所有更新操作以上均作为日志文件中的一个日志记录 (log record)。
      • 每条日志记录的内容
        • 事务标识(标明是哪个事务)
        • 操作类型(插入、删除或修改)
        • 操作对象(记录ID、Block NO)
        • 更新前数据的旧值(对插入操作而言,此项为空值)
        • 更新后数据的新值(对删除操作而言, 此项为空值)
    • 以数据块为单位的日志文件
      • 每条日志记录的内容
        • 事务标识
        • 被更新的数据块
日志文件的作用
  • 用途

    • 进行事务故障恢复
    • 进行系统故障恢复
    • 协助后备副本进行介质故障恢复
  • 具体作用

    • 事务故障恢复和系统故障恢复必须用日志文件。
    • 在动态转储方式中必须建立日志文件,后备副本和日 志文件结合起来才能有效地恢复数据库。
  • 在静态转储方式中,也可以建立日志文件。

    • 当数据库毁坏后可重新装入后援副本把数据库恢复到转 储结束时刻的正确状态。
    • 利用日志文件,把已完成的事务进行重做处理。
    • 对故障发生时尚未完成的事务进行撤销处理。
    • 不必重新运行那些已完成的事务

image-20210517105936686.png

登记日志文件
  • 为保证数据库是可恢复的,登记日志文件时必须遵循两条原则:
    • 登记的次序严格按并发事务执行的时间次序。
    • 必须“先写日志文件,后写数据库”
      • 写日志文件操作:把表示这个修改的日志记录写到日志文件中。
      • 写数据库操作:把对数据的修改写到数据库中。
为什么要先写日志文件
  • 写数据库和写日志文件是两个不同的操作。
  • 在这两个操作之间可能发生故障。
  • 如果先写了数据库修改,而在日志文件中没有登记下这 个修改,则以后就无法恢复这个修改了。
  • 如果先写日志,但没有修改数据库,按日志文件恢复时 只不过是多执行一次不必要的UNDO操作,并不会影响 数据库的正确性。
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Hydrion-Qlz

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值