MySQL commit一个dml,先写redolog 还是先记binlog顺序(这个图很好!好文章!)

mysql commit一个dml,在开启了binlog的情况下,为了保证binlog跟redo log 数据的一致性,mysql引入了两阶段提交。在事务commit的时候,会在两阶段提交的commit阶段,先将整个事务写入redolog,此时redolog还没有commit的标识。然后会将事务写入binlog,binlog commit成功之后,才会将commit标识写入redo log,并且告诉引擎层进行事务的提交。

以上的图片中可以看到,事务的提交主要分为两个主要步骤

1. 准备阶段(Storage Engine(InnoDB) Transaction Prepare Phase)

此时SQL已经成功执行,并生成xid信息及redo和undo的内存日志。然后调用prepare方法完成第一阶段,papare方法实际上什么也没做,将事务状态设为TRX_PREPARED,并将redo log刷磁盘。

2. 提交阶段(Storage Engine(InnoDB)Commit Phase)

2.1 记录协调者日志,即Binlog日志。

如果事务涉及的所有存储引擎的prepare都执行成功,则调用TC_LOG_BINLOG::log_xid方法将SQL语句写到binlog(write()将binary log内存日志数据写入文件系统缓存,fsync()将binary log文件系统缓存日志数据永久写入磁盘)。

2.2 告诉引擎做commit。

最后,调用引擎的commit完成事务的提交。会清除undo信息,刷redo日志。



转载自:https://www.jianshu.com/p/b958722222b1

<think>好的,我现在需要回答用户关于MySQL中数据页刷盘是随机写而redolog刷盘是顺序写的原因。首先,我需要明确用户的问题,并理解他们可能对MySQL的存储机制和日志系统不太熟悉,因此需要从基础开始逐步解释。 首先,我应该回忆MySQL的架构,特别是InnoDB存储引擎的部分。数据页通常是存储在表空间文件(如ibdata1或独立的.ibd文件)中的,而redo log则是用于崩溃恢复的日志文件。用户的问题涉及到这写入方式的区别,即为什么数据页的刷盘是随机写,而redo log顺序写。 接下来,我需要分析数据页和redo log的不同用途。数据页是实际存储数据的结构,当数据被修改时,这些修改首先在内存中的缓冲池(buffer pool)中进行,然后异步刷新到磁盘。而redo log记录的是对数据页的物理修改,用于在系统崩溃后恢复未刷新的数据页。 然后,我应该考虑磁盘I/O的特性。顺序写比随机写快得多,因为顺序写不需要频繁移动磁头(在HDD的情况下)或减少SSD的写入放大。因此,MySQL的设计者可能将redo log设计为顺序写,以提高写入性能,确保事务的持久性(ACID中的D)能够高效完成。 对于数据页的刷盘,由于数据页分散在表空间的各个位置,当缓冲池中的脏页需要刷新到磁盘时,这些页可能分布在不同的位置,导致随机写。此外,数据页的刷盘通常是异步的,由后台线程处理,而redo log的刷盘是在事务提交时必须完成的,因此需要更高的效率,顺序写更适合这种高频、必须快速完成的场景。 可能还需要考虑Checkpoint机制,它决定了哪些脏页需要刷盘,而redo log的循环使用方式也支持顺序写入。此外,redo log的文件是预先分配的,以固定大小循环使用,这样写入时总是追加到文件的末尾,形成顺序写。 用户可能存在的疑问包括:为什么数据页不能也顺序写?答案可能是因为数据页的位置由主键、索引等结构决定,无法保证连续,而redo log的结构设计允许连续写入。此外,数据页的刷盘策略(如LRU算法)可能导致随机访问模式。 需要确保解释清晰,避免技术术语过多,但又要准确。可能需要用比喻,比如将redo log比作连续记录操作的日志,而数据页像是分散在仓库中的货物,每次存取不同位置的货物导致随机访问。 最后,总结时强调写入方式的设计选择是基于它们不同的用途和性能优化考虑,确保MySQL事务处理和崩溃恢复上达到高效和可靠。</think>### 分步解析:MySQL 数据页刷盘(随机写)与 Redo Log 刷盘(顺序写)的本质区别 --- #### **、核心结论** - **数据页刷盘(随机写)**:数据页在磁盘上存储位置不连续,修改时需要按实际物理位置写入,导致随机I/O。 - **Redo Log 刷盘(顺序写)**:Redo Log 以追加方式写入固定大小的文件,形成连续地址写入,天然支持顺序I/O。 - **本质原因**:者的存储结构和用途不同,决定了写入方式的差异。 --- #### **二、底层机制对比** ##### **1. 数据页刷盘(随机写)** **核心流程**: 1. **修改发生**:事务修改数据时,先更新内存中的缓冲池(Buffer Pool)数据页。 2. **脏页标记**:修改后的数据页标记为“脏页”(Dirty Page)。 3. **刷盘触发**: - **后台线程周期性刷盘**(如每秒次)。 - **缓冲池空间不足时强制刷盘**(LRU机制)。 4. **写入磁盘**:将脏页按实际物理位置写回表空间文件(`.ibd` 文件)。 **随机写的原因**: - **数据分布不连续**:数据页在表空间中的物理位置由主键、索引结构决定,修改后的脏页可能分布在磁盘的不同位置。 - **异步刷盘**:刷盘操作是批量且延迟的,无法保证写入顺序。 - **碎片化写入**:频繁的增删改操作导致表空间文件产生碎片,进步加剧随机I/O。 ```text 示例:表空间文件(.ibd) +---------+---------+---------+ | 页1 (A) | 页2 (B) | 页3 (C) | --> 修改页1和页3后刷盘 +---------+---------+---------+ ↓ 磁盘写入:页1(位置0) → 页3(位置2) → 随机I/O ``` ##### **2. Redo Log 刷盘(顺序写)** **核心流程**: 1. **日志记录**:事务提交,将修改操作按顺序写入 Redo Log Buffer。 2. **刷盘策略**: - **策略1(默认)**:事务提交时强制刷盘(`innodb_flush_log_at_trx_commit=1`)。 - **策略2**:每秒刷盘(`innodb_flush_log_at_trx_commit=0/2`)。 3. **写入磁盘**:Redo Log 以追加方式写入日志文件(`ib_logfile0`、`ib_logfile1`)。 **顺序写的原因**: - **固定文件结构**:Redo Log 文件是预先分配的环形文件,写入时始终追加到当文件末尾。 - **物理连续写入**:日志条目按事务提交顺序连续写入,无地址跳跃。 - **崩溃恢复依赖**:顺序写保证日志的完整性,避免恢复时出现空洞。 ```text 示例:Redo Log 文件 +-------+-------+-------+-------+-------+ --> 始终追加写入 | Log1 | Log2 | Log3 | Log4 | ... | +-------+-------+-------+-------+-------+ 写入方向:→ 顺序追加 ``` --- #### **三、性能与设计权衡** | **维度** | **数据页刷盘(随机写)** | **Redo Log 刷盘(顺序写)** | |------------------|--------------------------------------------|-------------------------------------| | **写入速度** | 慢(HDD随机I/O吞吐量约100 IOPS) | 快(HDD顺序I/O吞吐量约200 MB/s) | | **可靠性** | 异步刷盘可能丢失未提交数据 | 事务提交时强制刷盘保证持久性 | | **设计目标** | 平衡内存与磁盘性能,减少频繁刷盘开销 | 最大化写入吞吐量,保障事务持久性 | | **优化手段** | 缓冲池(Buffer Pool)、Change Buffer | 组提交(Group Commit) | --- #### **四、关键问题解答** ##### **1. 为什么 Redo Log 不设计为随机写?** - **性能需求**:事务提交要求高吞吐量,顺序写速度是随机写的数百倍。 - **崩溃恢复**:顺序写保证日志连续性,恢复时无需跳跃读取。 ##### **2. 数据页能否改为顺序写?** - **不可行**:数据页的物理位置由索引结构(如B+树)决定,无法强制连续存储。 - **代价过高**:若强制按顺序存储,会破坏索引的高效查询特性。 ##### **3. Redo Log 如何避免写满?** - **Checkpoint 机制**:定期将 Redo Log 中的已提交修改刷盘到数据页,释放日志空间。 - **循环复用**:Redo Log 文件以环形结构复用,覆盖已刷盘的旧日志。 --- #### **五、总结** - **数据页随机写**:由数据存储的物理分布特性决定,是权衡查询性能与刷盘开销的结果。 - **Redo Log 顺序写**:为满足事务持久性与高吞吐量需求,利用磁盘顺序I/O优势。 - **设计哲学**:通过 Redo Log 的**顺序写**牺牲少量日志空间,换取事务提交的高性能;通过数据页的**随机写**容忍延迟刷盘,保障查询效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值