十. 数据库恢复技术
10.1 事务的基本概念
10.1.1 事务
1. 基础概念
- 事务:用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位
- 事务和程序是两个概念
- 在关系数据库中,一个事务可以是一条SQL语句(单语句事务),一组SQL语句或者整个程序(多语句事务)
- 一个程序通常包含多个事务
- 事务是恢复并非控制的基本单位
2. 定义事务
-
显示定义方式
BEGIN TRANSACTION SQL 语句1 SQL 语句2 .... COMMIT /*事务正常结束 提交事务的所有操作 事务中所有对数据库的更新写回到磁盘上的物理数据库中 相当于全做*/ BEGIN TRANSACTION SQL 语句1 SQL 语句2 .... ROLLBACK /*事务异常终止 事务运行的过程中发生了故障,不能继续执行 系统将事务中对数据库的所有已完成的操作全部撤销 事务滚回开始时的状态 相当于全不做*/
-
隐式方式
当用户没有显示的定义事务时,数据库管理系统按缺省值规定自动划分事务
10.1.2 事务的ACID特性
1. 原子性
-
事务时数据库的逻辑工作单位
事务中包括的诸操作要么全做,要么全不做
2. 一致性
- 事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态
- 一致性状态
- 数据库中只包含成功事务提交的结果
- 不一致状态
- 数据库系统运行中发生故障,有些事务尚未完成就被迫中断
- 这些未完成的事务对数据库所作的修改有一部分已经写入物理数据库,这时数据库就处于一个不正确的状态
3. 隔离性
- 一个事务的执行不能被其他事务干扰
- 一个事务内部的操作以及使用的数据对其他并发事务时隔离的
- 并发执行的各个事务之间不能相互干扰
4.持续性
- 持续性也称永久性
- 一个事务一旦提交,它对数据库中数据的改变就应该是永久的
- 接下来的其他操作或故障不应该对其执行结果有任何影响
- 保证事务ACID特性是事务处理的任务
- 破坏事务ACID特性的因素
- 多个事务并行时,不同事物的操作交叉执行
- 事务在运行过程中被强行停止
10.2 数据库恢复概述
-
故障时不可避免的
- 计算机硬件故障
- 软件的错误
- 操作员的失误
- 恶意的破坏
-
故障的影响
- 运行事务非正常中断,影响数据的正确性
- 破坏数据库,全部或者部分丢失数据
-
数据库的恢复
数据库管理系统必须具有把数据库从错误状态恢复到某一已知的正确状态(亦称为一致状态或完整状态)的功能,这就是数据库的恢复管理系统对故障的对策。
-
恢复子系统是数据库管理系统的一个重要组成部分
-
恢复技术是衡量系统优劣的重要指标
10.3 故障的种类
1. 事务内部的故障
- 有的是可以通过事务程序本身发现的
- 有的是非预期的,不能有事务程序处理的
- 事务内部更多的故障是非预期的,是不能用应用程序处理的
- 运算溢出
- 并发事务发生死锁而被选中撤销该事务
- 违反了某些完整性限制而被终止等
- 后面,事务故障仅指这内非预期的故障
- 事务故障意味着
- 事务没有达到预期的终点(COMMIT或显示的ROLLBACK)
- 数据库可能处于不正确状态
- 事务故障的恢复:事务撤销(UNDO)
- 强行回滚(ROLLBACK)该事务
- 撤销该事务已经作出的任何对数据库的修改,使得该事务像没有启动一样
2. 系统故障
-
系统故障
称为软故障,是指造成系统停止运转的任何事件,使得系统要重新启动
- 特定类型的硬件错误(如CPU故障)
- 操作系统故障
- 数据库管理系统代码错误
- 系统断电
-
影响
- 整个系统的正常运行突然被破坏
- 所有正在运行的事务都非正常终止(所有活跃事务都只运行 了一部分,没有完全完成)
- 内存中数据库缓冲区的信息全部丢失
- 不破坏数据库
-
发生系统故障时,一些尚未完成的事务的结果可能已经送入到物理数据库,造成数据库可能处于不正确状态
- 恢复策略:系统重新启动时,恢复程序让所有非正常终止的事务回滚,强行撤销(UNDO)所有未完成事务。
-
发生系统故障时,有些已完成的事务可能有一部分甚至全部留在缓冲区,尚未写回到磁盘上的物理数据库中,系统故障使得这些事务对数据库的修改部分或全部丢失
- 恢复策略:系统重新启动时,恢复程序需要重做(REDO)所有已经提交的事务
-
系统故障的恢复需要做两件事
- 撤销所有未完成的事务
- 重做所有已提交的事务
3. 介质故障
- 称为硬故障,指外存故障
- 磁盘损坏
- 磁头碰撞
- 瞬时强磁场干扰
- 介质故障破坏数据库或部分数据库,并影响正在存取这部分数据的数据库的所有事务
- 介质故障比前两类故障的可能性小的多,但破坏性大得多
4. 计算机病毒
- 一种人为的故障或破坏,是一些恶作剧者研制的一种计算机程序
- 可以繁殖和传播,造成对计算机系统包括数据库的危害
- 计算机病毒已成为计算机系统的主要威胁,自然也是数据库系统的主要威胁
- 数据库一旦被破坏仍要用恢复技术把数据库加以恢复
10.4 恢复的实现技术
-
恢复操作的基本原理:冗余
- 利用存储在系统别处的冗余数据来重建数据库中已被破坏或不正确的数据
-
恢复的实现技术:复杂
- 一个大型的数据库产品,恢复子系统的代码要占全部代码的10%以上
-
如何建立冗余数据
-
数据转储(backup)
-
登录日志文件(logging)
-
10.4.1 数据存储
1. 什么是数据存储
- 转储是指数据库管理员定期将整个数据库复制到磁带、磁盘或其他存储介质上保存起来的过程
- 备用数据文本称为后备副本(backup)或者后援副本
- 数据库遭到破坏以后可以将后被副本重新装入
- 重装后备副本只能将数据库恢复到转储时的状态
- 要想恢复故障发生时的状态,必须重新运行自转储以后的所有更新事务
2. 存储方法
静态转储和动态转储
- 静态转储
- 在系统中五运行事务时进行的转储操作
- 转储开始时数据库处于一致性状态
- 转储期间不允许对数据库的任何存取修改活动
- 得到的一定是一个数据一致性的副本
- 优点:简单
- 缺点:降低了数据库的可用性
- 转储必须要等正运行的用户事务结束
- 新书屋必须等转储技术
- 转储操作与用户事务并发进行
- 转储期间允许对数据库进行存取或修改
- 优点
- 不用等待正在运行的用户事务结束
- 不会影响新事物的运行
- 缺点
- 不能保证副本中的数据正确有效
- 利用动态转储得到的副本进行故障恢复
- 需要把动态转储期间各事务对数据库的修改活动登记下来,建立日志文件
- 后备副本加上日志文件就能把数据库恢复到某以时刻的正确状态
海量转储与增量转储
- 海量转储:每次转储全部数据库
- 增量转储:只转储上次转储后更新过的数据
- 海量转储和增量转储比较
- 从恢复角度来看,使用海量转储得到的后备副本进行恢复往往更方便
- 如果数据库很大,事务处理又非常繁琐,则增量转储方式更实用有效
转储方式小结
转储方式 | 转储状态 | |
---|---|---|
动态转储 | 静态转储 | |
海量转储 | 动态海量转储 | 静态海量转储 |
增量转储 | 动态增量转储 | 静态增量转储 |
在数据转储效率、数据库运行效率和故障恢复效率三方面各有利弊
10.4.2 登录日志文件
1. 日志文件的格式和内容
-
日志文件
- 日志文件是用来记录事务对数据库的更新操作的文件
-
以记录为单位的日志文件内容
- 各个事务的开始标记(BEGIN TRANSACTION)
- 各个事务的结束标记(COMMIT或ROLLBACK)
- 各个事务的所有更新操作
以上均作为日志文件中的一个日志记录
-
记录事务开始标记的日志记录
- 事务标记+BEGIN TRANSACTION
-
记录事务结束标志的日志记录
- 事务标记+COMMIT
- 事务标记+ROLLBACK
-
记录事务更新操作的日志记录
2. 日志文件的作用
- 用途
- 进行事务故障恢复
- 进行系统故障恢复
- 协助后备副本进行介质故障恢复
- 具体作用
- 事务故障恢复和系统故障恢复必须使用日志文件
- 在动态转储方式中必须建立日志文件,后备副本和日志五年间结合起来才能有效的恢复数据库
- 在静态转储方式中,也可以建立日志文件
3. 登录日志文件
- 为保证数据库是可恢复的,登录日志文件时必须遵循两条原则
- 登录的次序严格按并发事务执行的事件次序
- 必须先写日志文件,后写数据库
10.5 恢复策略
10.5.1 事务故障的恢复
- 事务故障:事务在运行至正常终点前被终止
- 恢复方法
- 由恢复子系统利用日志文件撤销(UNDO)此事务已对数据库进行的修改
- 事务故障的恢复主要由系统自动完成,对用户时透明的,不需要用户干涉
10.5.2 系统故障的恢复
- 系统故障造成数据库不一致状态的原因
- 未完成事务对数据库的更新可能已经写入数据库
- 已提交的事务对数据库更新可能还留在缓冲区没来得及写入数据库
- 恢复方法
- UNDO故障发生时未完成的事务
- REDO已完成的事务
- 系统故障的恢复由系统在重新启动时自动完成,不需要用户干预
10.5.3 介质故障的恢复
- 恢复步骤
- 装入最新的后备数据库副本(离故障发生时刻最近的转储副本),使数据库恢复到最近一次转储时的一致性状态
- 对于静态转储的数据库副本装入数据库即处于一致性状态
- 对于动态转储的数据库副本,还需要同时装入转出时刻的日志文件副本,利用恢复系统故障的方法(REDO+UNDO),才能将数据库恢复到一致性状态。
- 装入有关的日志文件副本(转储结束时刻的日志文件副本)重做已完成的事务
- 装入最新的后备数据库副本(离故障发生时刻最近的转储副本),使数据库恢复到最近一次转储时的一致性状态
- 介质故障的恢复需要DBA的介入
- DBA的工作
- 重装最近转储的数据库副本和有关的各日志文件副本
- 执行系统提供的恢复命令
- 具体的恢复操作任由DBMS完成