数据库系统-故障恢复

一、数据库故障恢复思路

1.1 故障类型 影响

1.1.1 DMBS运行方式

利用主存(内存) 和 辅存(外存) 存储体系进行数据库管理
主存中分为:程序数据 + 系统数据
在这里插入图片描述

1.1.2 故障类型

事务故障

  • 某个事务自身运行引起的故障
  • 影响该事物本身

系统故障

  • 掉电、非正常关机等引起的故障
  • 影响正在运行的事务以及数据库缓冲区

介质故障

  • 介质损坏影响的故障
  • 影响是全面的,既影响内存中的数据,又影响介质中的数据

1.2 故障恢复

1.2.1 数据库故障恢复

把DB的当前不正确的状态恢复成已知的正确的状态
需要保证事务的:

  • 原子性:事务的所有操作为一个整体
  • 持久性:已经提交的事务,落盘 是 肯定的

1.2.2 事务故障恢复

事务可以通过重做事务Redo 和 撤销事务Undo来恢复

1.2.3 系统故障恢复

运行日志SystemLog

  • Log是DBMS维护的一个文件,以流水方式记录了每一事务对DB的每一次操作&操作的顺序
  • 运行日志直接写入介质存储上,会保持正确性
  • 事务对DB操作时,先写日志(1) 成功后 在写入DB(2)
    在这里插入图片描述

系统故障可以通过运行日志来恢复
故障恢复是需要时间的
DBMS在运行日志中定期设置河更新检查点Checkpoint

  • 检查点是这样的时刻:在该时刻,DBMS强制使内存DBbuffer中的内容和介质DB中的内容保持一致,将DBbuffer更新的所有内容写会DB中
  • 检查点表示:在检查点之前,内存中的数据与介质中的数据保持一致

系统故障的恢复

  • 检查点之前的事务不需要恢复(因为已经落盘)
  • 检查点之后的事务需要恢复(结束的重做,未结束的撤销)

在这里插入图片描述

1.2.4 介质故障恢复

副本:在某一时刻,数据库的备份
用备份来替换损坏的数据库
介质故障的恢复:用副本来替换数据库
由于介质故障影响全面,在副本替换后 还需要 日志恢复

备份时刻:转储点
过频,影响性能;过疏,运行日志过大,恢复起来慢
频率和运行日志大小有关

数据库的系统故障分为三类:事务故障、系统故障和介质故障,下面分别介绍这三类故障及其例子:

事务故障
事务故障是指在多个事务并发执行时,由于事务之间相互干扰而导致的故障。例如,当两个事务同时对同一条记录进行更新时,由于数据竞争可能导致其中一个事务无法完成操作。这种情况下,数据库管理系统需要能够检测到此类故障,并回滚未完成的事务,以保证数据的一致性。

举例来说,假设有两个事务T1和T2,都要对银行账户的余额进行修改。T1从账户中取出了100元,T2向账户中存入了50元。由于这两个事务的执行时间是交错的,所以可能会发生以下两种情况:

T1先执行,将账户余额减去100元,然后T2执行,将账户余额加上50元。此时账户余额为950元。
T2先执行,将账户余额加上50元,然后T1执行,将账户余额减去100元。此时账户余额为900元。
由于这两种情况得到的结果不同,因此需要避免这种数据竞争导致的事务故障。

系统故障
系统故障是指由于硬件故障或软件问题导致的数据库系统崩溃或失效。例如,电源故障、网络故障、操作系统故障等都可能导致系统故障。这种故障需要进行紧急处理,保证系统能够尽快恢复正常运行。

举例来说,假设数据库在写入数据时出现了错误,导致存储介质损坏或无法访问,这种情况下将会导致系统故障。

介质故障
介质故障是指由于存储介质的物理损坏或软硬件环境变化导致的数据库故障。例如,磁盘损坏、电磁波干扰、温度过高等都可能导致介质故障。这种故障需要及时修复或更换存储介质,以避免数据的长期损失。

举例来说,假设数据库存储在一台服务器上,该服务器所在的机房发生火灾,导致存储介质被烧毁,这种情况下将会导致介质故障。

综上所述,事务故障、系统故障和介质故障是数据库系统常见的故障类型,需要通过适当的技术手段进行检测、修复和预防。

二、运行日志及其检查点

2.1 DB Log

2.1.1 事务的操作

事务读写元素

  • Read(X,t):将元素X读到局部变量t中
  • writex(X,t):将事物局部变量t学回元素X
  • Input(X):将元素X从磁盘读入到内存缓冲区中
  • Output(X):将元素X写回到磁盘中
    每个事务都可以提交或者撤销
  • commit
  • abort

2.1.2 缓冲区处理策略

持久性的特性:

Force:内存中的数据最晚在commit的时候写入磁盘
No Steal:只能在commit的时候提交,不允许事务提前提交
No force:数据在内存中可以一直保留,在commit之后一段时间再写入磁盘,commit之后崩溃还没写,需要redo
Steal:允许commit之前落盘,if commit is failed, 需要undo
在这里插入图片描述

2.2 日志记录

在这里插入图片描述
在这里插入图片描述

三、三种类型的运行日志

3.1 Undo日志

记录原始值
在这里插入图片描述
Undo型日志:“将事务改变的所有数据写到磁盘前不能提交该事务”
记录的原始值
故障时直接恢复原始值
Undo日志:Undo日志记录了事务进行之前数据的原始状态,以及每个事务所做的修改,用于在回滚时恢复数据原始状态。在数据库回滚操作中,首先会根据事务的ID,找到该事务对应的Undo日志,然后根据Undo日志中的信息,恢复数据到事务之前的状态。例如,如果一个事务对某个用户的姓名进行了修改,在回滚时,可以使用Undo日志中记录的原始姓名信息,将数据恢复至修改之前的状态。

3.1.1 检查点

在这里插入图片描述

3.2 Redo日志

记录修改的操作
在这里插入图片描述记录修改操作 +1 +2 之类的
Redo日志:Redo日志记录了每个事务所做的修改操作,用于在系统发生崩溃时进行恢复。在数据库恢复操作中,首先会根据Redo日志中的信息,将缺失的数据重新写入磁盘中,以保证数据的完整性。例如,在一个在线购物网站中,如果在用户提交订单后,系统崩溃了,使用Redo日志可以将该订单重新写入磁盘中,确保订单信息不会丢失。

只能有非静止检查点(增量检查点)

3.3 Undo/Redo日志结合

记录原始值和修改的值
在这里插入图片描述
Undo、Redo日志对比

  • Undo
    • output必须先做
    • if commit T可见,那么T已经落盘,不必重做。
    • 导致频繁写磁盘
  • Redo
    • output必须后做
    • if commit T 不可见,T确定没有任何数据落盘,因此无需撤销。
    • 灵活性差,数据必须在commit之后才能见到

Redo/Undo日志:Redo/Undo日志综合了Undo和Redo日志的功能,在事务进行过程中,同时记录当前状态和操作,用于在系统崩溃时和事务回滚时进行数据恢复。在Redo/Undo日志中,Undo操作和Redo操作都会被记录下来,以保证数据的完整性和一致性。例如,如果在一个医院管理系统中,一个医生修改了某个病人的病历记录,系统同时会记录下原始病历记录和修改后的病历记录,以便在医生需要撤销修改或系统崩溃时恢复数据
在这里插入图片描述

四、利用运行日志进行故障恢复

  • 5
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
openGauss是一款开源的关系型数据库管理系统,它具有多核高性能、全链路安全性、智能运维等企业级特性。 openGauss内核早期源自开源数据库PostgreSQL,融合了华为在数据库领域多年的内核经验,在架构、事务、存储引擎、优化器及ARM架构上进行了适配与优化。作为一个开源数据库,期望与广泛的开发者共同构建一个多元化技术的开源数据库社区。 软件特点: 1、高性能 openGauss突破了多核CPU的瓶颈,实现两路鲲鹏128核150万tpmC,内存优化表(MOT)引擎达350万tpmC。 2、数据分区 内部线程共享的关键数据结构进行数据分区,减少加锁访问冲突。比如CLOG就采用分区优化,解决ClogControlLock锁瓶颈。 3、NUMA化内核数据结构 关键数据结构NUMA化分配,减少跨CPU访问。比如全局PGPROC数组按照NUMA Node的数目分为多份,分别在对应NUMA Node上申请内存。解决ProcArrayLock锁瓶颈。 4、绑核优化 把网络断绑核和后台业务线程绑核区分开,避免运行线程在核间迁移造成的性能不稳定。 5、ARM指令优化 结合ARM平台的原子操作lse进行优化,实现关键互斥变量原子高效操作。 6、SQL BY PASS 通过SQL BY PASS优化SQL执行流程,简化CPU执行开销。 7、高可靠 正常业务负载情况下,RTO小于10秒,降低节点故障导致的业务不可用时间。 8、并行恢复 主机日志传输到备机时,备机日志落盘的同时,发送给重做恢复分发线程,分发线程根据日志类型和日志操作的数据页发给多个并行恢复线程进行日志重做,保证备机的重做速度跟上主机日志的产生速度。这样备机实时处于ready状态,从而实现瞬间故障切换。 9、MOT引擎(Beta发布) 内存优化表(MOT)存储引擎是一个专为多核大内存优化的存储引擎,具有极高的联机事务处理(OLTP)性能和资源利用率。MOT的数据和索引完全存储在内存,通过NUMA感知执行,算法消除闩锁争用以及查询JIT本地编译,提供低时延数据访问及高效事务执行。更多请参考MOT引擎文档。 10、安全 openGauss支持账号管理,账号认证,口令复杂度检查,账号锁定,权限管理和校验,传输加密,操作 审计等全方位的数据库安全能力,保护业务满足安全要求。 11、易运维 openGauss将AI算法集成到数据库,减少数据库维护的负担。 12、SQL预测 openGauss根据收集的历史性能数据进行编码和基于深度学习的训练及预测,支持SQL执行时间预测。 13、SQL诊断器 openGauss支持SQL执行语句的诊断器,提前发现慢查询。 14、参数自动调整 openGauss通过机器学习方法自动调整数据库参数,提高调参效率,降低正确调参成本。
1. 填空 分布式数据库系统按局部数据库管理系统的数据模型分类,可以分为 和 两类。 同构型DDBS 异构型DDBS 分布式数据库系统按全避控制系统类型分类,可以分为 、 和 三类。 全局控制集型DDBS 全局控制分散型DDBS 全局控制可变型DDBS 分布式数据库是分布式数据库系统各站点上数据库的逻辑集合,它由 和 组成。 应用数据库 描述数据库 数据分片的三种基本方法是: 、 和 三类。 水平分片 垂直分片 混合分片 分布式数据库的数据分布策略有: 、 、 和 四层。 集式 分割式 复制式 混合式 分布式数据库是多层模式结构,一般划分为 、 、 和 四层。 全局外层 全局概念层 局部概念层 局部内层 一个分布式数据库管理系统一般应包括 、 、 和 四个基本功能模块。 查询处理模块 完整性处理模块 调度处理模块 可靠性处理模块 分布透明性包括 、 和 三个层次。 分片透明性 位置透明性 局部数据模型透明性 分布式数据库系统的创建方法,大致可分为 和 两种。 组合法 重构法 集数据库设计一般包括:需求分析,概念设计,逻辑设计和物理设计四个阶段,分 布式数据库设计除了上述四个阶段外,还需增加一些个新的阶段 ,它位于 和 之间。 分布设计 逻辑设计 物理设计 水平分片的方法可归为 和 两种。 初级分片 导出分片 DATAID-D相对于DATAID-1增加了 和 两个阶段。 分布要求分析 分布设计 DATAID-D的分布设计分成 、 、 和 四个阶段。 分片设计 非冗余分配 冗余分配 局部模式的重新构造 分布式查询优化的准则是 。 通信费用和响应时间最短 在分布式系统,查询代价QC= 。 I/O代价+CPU代价+通信代价 在分布式环境下,查询可分为 、 和 三种类型。 局部查询 远程查询 全局查询 分布式查询处理可以分为 、 、 和 四层。 查询分解 数据本地化 全局优化 局部优化一个分布式事务通常是由 和 组成。 主事务 子事务 事务的四个特性是: 、 、 和 。 原子性 一致性 隔离性 耐久性 控制分布式事务所执行的控制模型有: 、 和 。 主从模型 三角模型 层次模型 分布式数据库系统,通信故障可以分为 和 两种。 报文故障 网络分割故障 事务恢复主要是依靠 来实现的。 日志 并发控制机制可以为 和 两种类型。 悲观并发控制法 乐观并发控制法 常用的基本封锁算法有: 、 、 和 。 简单的分布式封锁方法 主站点封锁法 主副本封锁法 快照方法 预防死锁的方法有 和 两种类型。 非占先权方法 占先权方法 检测分布式死锁的三种方法是 、 和 。 集式 层次式 分布式 2. 简答题 分布式数据库系统的特点是什么 答:物理分布性:数据不是存放在一个站点上 逻辑整体性:是与分散式数据库系统的区别 站点自治性:是与多处理机的系统的区别 数据分布透明性 集与自治相结合 存在适当的数据冗余度 事务管理的分布性 分布式数据库数据分片的规则是什么 答:(1)完备性原则:必须把全局关系的所有数据映射到各自片段,绝不允许有属于 全局关系的数据却不发球它的任何一个片段。 (2)可重构原则:必须保证能够由同一个全局关系的各个片段来重建该全局关系。对于 水平分片可用并操作重构全局关系,对于垂直分片可用连接操作重构全局关系。 (3)不相交原则:关系分片后的各个片断不能重叠或只包含主键重叠。 DATAID-D相对于DATAID-1增加哪两个阶段,这两个阶段的具体工作是什么 答:(1)分布要求分析阶段:收集关于分布的信息,如水平分片的划分谓词,每一应用 在各站点激活的频率等。 (2)分布设计阶段:始于全局数据库模式的规格说明和所收集的分布要求,然后产生全 局数据的分片模式和片段的位置分配模式,分配模式描述了分配在各站点上的数据情况 。 分布式事务的一般结构是什么 答:分布式事务的一般结构为: Begin Transaction原语:开始一个事务(2分) T1[] T2[] : 子事务或操作序列 : Tn[] Commit原语:事务成功完成的结束(2分) Rollback或Abort原语:事务失败的结束(1分) 5. 论述题 分布式数据库,"数据分配"有哪些策略"数据分片"有哪些策略 数据分片的准则是什么 数据分配是指数据在计算机网络各场地上的分配策略。包括: (1)集式:所有数据均安排在同一个场地上。 (2)分割式:所有数据只有一份,分别被安置在若干个场地。 (3)全复制式:数据在每个场地重复存储。 (4)混合式:数据库分成若干可相交的子集,每一子集安置在一个或多个场地上,但是 每一场地未必保存全部数据。 数据分片的方式有以下三种: (1)水平分片:按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子 集为关系的一个片段。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

oifengo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值