数据库Recovery

最新推荐文章于 2024-10-02 00:27:17 发布

编程小白进阶札记

最新推荐文章于 2024-10-02 00:27:17 发布

阅读量150

点赞数

文章标签：数据库

本文链接：https://blog.csdn.net/weixin_47895938/article/details/132298291

版权

Recovery

恢复算法是确保数据库一致性、事务原子性和在故障情况下持久性的技术。

恢复算法有两部分：

正常txn处理期间的操作，以确保DBMS可以从故障中恢复。
将数据库恢复到确保原子性、一致性和持久性的状态失败后的操作。

ARIES

Main Ideas

Write-Ahead Logging
- 在数据库更改写入磁盘之前，任何更改都会记录在稳定存储上的日志中。
- 必须使用STEAL + NO-FORCE缓冲池策略
Repeating History During Redo
- 在DBMS重新启动时，追溯操作并将数据库恢复到崩溃前的确切状态。
Logging Changes During Undo
- 将撤消操作记录到日志中，以确保在重复失败时不会重复操作。

Log Swquence Numbers

Logging的拓展记录格式
每个日志记录都包括一个全局唯一的日志序列号（LSN）。

LSN表示txns对数据库进行更改的物理顺序。

Log Sequence Numbers

日志序列号	存储位置	定义
flushedLSN	缓冲区控制块 Memory	最近一个已经将脏数据写入磁盘的日志序列号。
pageLSN	数据页Page	数据页中最近一条记录的日志序列号，表示该页的修改状态。
recLSN	数据页Page	数据页自上次刷新以来的最旧更新。
lastLSN	T_i	表示事务的最后一次操作所使用的日志序列号，用于恢复和回滚事务。
MasterRecord	Disk	最后一次checkpoint的LSN。

Writing Log Records

每个数据页都包含一个pageLSN。

该页的最新更新的LSN

系统跟踪已刷新的LSN

到目前为止，最大LSN刷新了

在DBMS可以将页面x写入磁盘之前，它必须至少将日志刷新到pageLSNx ≤ flushedLSN

所有日志记录都有一个LSN

每次txn修改页面中的记录时，更新页面LSN。

每次DBMS将WAL缓冲区写入磁盘时，更新内存中的刷新LSN。

Normal Executiion

每个txn调用一系列读取和写入，然后是提交或中止

Assumptions:

所有日志记录都适合在一个页面中
磁盘写入是原子的。
具有强严格2PL的单版本元组。
Steal + No-Force缓冲区管理

Transaction Commit

当txn提交时，DBMS将一个提交记录写入日志，并保证直到txn的提交记录的所有日志记录都刷新到磁盘。

日志刷新是顺序的，同步写入磁盘
每个日志页有多条日志记录

提交成功后，写入一条特殊的TXN-END记录到日志中。

指示txn的新日志记录将不再出现在日志中
这不需要立即flash

Transaction Abort

中止txn是仅应用于一个txn的ARIES undo操作的特殊情况。

我们需要在日志记录中添加另一个字段：

prevLSN:txn的上一个LSN
这为每个txn维护了一个链表，可以轻松地浏览其记录。

Compensation Log Records

CLR描述了为撤消先前更新记录的操作而采取的操作。
它具有更新日志记录的所有字段加上undoNext指针（下一个要撤消的LSN）。
CLR将添加到日志记录中，但DBMS不会等待它们被刷新，然后通知应用程序txn已中止。

Abort Algorithm

首先写入一个ABORT记录以记录txn。

然后按相反的顺序分析txn的更新。对于每个更新记录

将CLR条目写入日志
恢复旧值

最后，写入TXN-END记录并释放锁
Notice: CLRs never need to be undone.

Non-Fuzzy Checkpoints

DBMS在使用检查点时停止所有操作，以确保快照的一致性

停止任何新的txns的开始。
等待所有活动的txns执行完毕
刷新磁盘上的脏页。

这对运行时性能有害，但使恢复变得容易。

Slightly Better Checkpoints

在DBMS采取检查点时暂停修改txns。

防止查询获取表/索引页上的写锁。
不必等到所有的txns完成后再CheckPoint。

必须记录检查点开始时的内部状态。

A ：Activate表示一个活跃状态的事务。活跃状态的事务是正在执行或正在等待的事务。在事务执行期间，相关的操作会被记录在日志中，以便在需要时进行回滚或恢复操作。
DPT:Dirty Page Table脏页表是数据库内部的一个数据结构，用于跟踪在内存中已被修改但尚未写入磁盘的数据页。每当数据库中的数据页被修改时，相应的数据页会被标记为 “脏”，即已被更改但尚未同步到磁盘。脏页表记录了这些脏页的信息，以便在适当的时候将其写回到磁盘，确保数据的持久性和一致性。
ATT:Activate Transaction Table活跃事务表是数据库内部用于跟踪当前活跃事务的数据结构。每当一个事务开始执行时，相关信息（如事务 ID、状态等）会被记录在活跃事务表中。在数据库管理系统中，活跃事务表的维护对于并发控制和恢复操作至关重要。这些信息可用于监控事务状态，处理并发操作以及在需要时执行恢复操作

Activate Transaction Table
每个当前活动的txn一个entry。