mysql之InnoDB Buffer Pool 深度解析与性能优化

最新推荐文章于 2025-02-27 15:42:35 发布

我爱松子鱼

最新推荐文章于 2025-02-27 15:42:35 发布

阅读量1.5k

点赞数 32

分类专栏： mysql运行机制文章标签： mysql 性能优化 android

本文链接：https://blog.csdn.net/qq_43460315/article/details/145796125

版权

文章目录

InnoDB Buffer Pool 深度解析与性能优化

InnoDB Buffer Pool 深度解析与性能优化

1. 概述：平衡磁盘与 CPU 的关键枢纽

InnoDB Buffer Pool 是 MySQL InnoDB 存储引擎中至关重要的内存组件，它作为磁盘数据页和 CPU 之间的缓冲层，显著提升了数据访问速度，是 MySQL 性能优化的核心。深入理解 Buffer Pool 的工作原理和调优策略，对于构建高性能 MySQL 应用至关重要。

1.1. Buffer Pool 的本质与作用

Buffer Pool 本质上是一个 内存区域，用于缓存从磁盘读取的 数据页 和 索引页。当 MySQL 需要访问数据时，首先会检查 Buffer Pool 中是否存在所需页。

缓存命中 (Cache Hit): 如果数据页已存在于 Buffer Pool 中，则直接从内存读取，速度极快，避免了昂贵的磁盘 I/O 操作。
缓存未命中 (Cache Miss): 如果数据页不在 Buffer Pool 中，则需要从磁盘读取到 Buffer Pool 中，然后再进行访问。

Buffer Pool 的核心作用在于 减少磁盘 I/O，因为内存访问速度远快于磁盘访问速度。通过将热点数据缓存在内存中，Buffer Pool 有效地提高了查询和更新操作的性能。

1.2. 多级缓存体系

InnoDB 采用多级缓存体系来提升性能，Buffer Pool 是其中的核心组件。整体缓存架构可以概括为：

Buffer Pool -> Change Buffer -> Adaptive Hash Index -> Log Buffer

Buffer Pool: 主要缓存数据页和索引页，是访问频率最高的数据缓存。
Change Buffer (Insert Buffer): 缓存非唯一索引页的变更操作，减少随机 I/O，提高写入性能。
Adaptive Hash Index (自适应哈希索引): InnoDB 自动为热点索引页创建哈希索引，加速等值查询。
Log Buffer: 缓存 Redo Log 日志，提高事务提交效率。

2. Buffer Pool 的内部机制

2.1. 页 (Page) 的概念

InnoDB 存储引擎将磁盘上的数据划分为固定大小的 页 (Page)，默认大小为 16KB。Buffer Pool 管理和缓存的基本单位就是页。页的类型包括：

数据页 (Data Page): 存储表中的实际数据行。
索引页 (Index Page): 存储索引信息，加速数据查找。
Undo 页 (Undo Page): 用于事务回滚和 MVCC (多版本并发控制)。
系统页 (System Page): 存储系统元数据。
其他辅助页: 如 Insert Buffer Bitmap Page, Insert Buffer Index Page 等。

2.2. Buffer Pool 的组成结构

Buffer Pool 在内存中被划分为多个 帧 (Frame)，每个帧可以缓存一个数据页。为了高效管理这些帧，Buffer Pool 采用了复杂的链表结构：

LRU 链表 (Least Recently Used List): 这是 Buffer Pool 的核心链表，用于跟踪页面的访问时间，实现页面的淘汰机制。
- New Sublist (Young 区/New 列表): 存储最近被频繁访问的页 (热页)，大约占 LRU 链表的 5/8。链表头部是最近被访问的页，尾部是相对较少被访问的页。
- Old Sublist (Old 区/Old 列表): 存储相对较少被访问的页 (冷页)，大约占 LRU 链表的 3/8。链表尾部是最久未被访问的页，是淘汰的候选页。可以通过 innodb_old_blocks_pct 参数调整 Old Sublist 的比例，默认为 37%。
- Midpoint Insertion Strategy (中点插入策略): 新读取的页，并非直接插入 LRU 链表头部，而是插入到 LRU 链表的中点位置 (更精确地说是 Old Sublist 的头部)。这样做的目的是为了防止 顺序扫描 等操作将大量只访问一次的页直接冲刷掉 Buffer Pool 中的热页。
- Page Aging (页老化): 当 Old Sublist 中的页被访问时，如果页在 Old Sublist 中停留时间超过 innodb_old_blocks_time (默认为 1 秒)，则会被移动到 New Sublist 的头部，提升其优先级，避免被过早淘汰。
Free 链表 (Free List): 存储空闲的帧，当需要从磁盘读取新的页时，首先从 Free 链表中获取可用的帧。如果 Free 链表为空，则需要从 LRU 链表尾部淘汰最近最少使用的页，将其帧加入 Free 链表。
Flush 链表 (Flush List，也称为 Dirty Page List): 存储被修改过的页 (脏页)。当脏页需要刷新到磁盘时，会从此链表中取出。

这些链表中真正存放的是控制块：每一个缓存页都创建了一些所谓的控制信息，这些控制信息包括该页所属的表空间编号、页号、缓存页在Buffer Pool中的地址、链表节点信息、一些锁信息以及LSN信息等，控制块与缓存页是一一对应的

2.3. Buffer Pool 的工作流程 (数据页的生命周期)

读取数据页:
- 当查询需要访问某个数据页时，InnoDB 首先检查 Buffer Pool 中是否存在该页 (根据页号或索引键哈希查找)。
- 如果命中 (Buffer Pool Hit): 直接返回 Buffer Pool 中的页，并将该页移动到 LRU 链表 New Sublist 的头部 (或附近，根据具体实现)。
- 如果未命中 (Buffer Pool Miss):
1. a. 从 Free 链表中获取一个空闲帧。
2. b. 如果 Free 链表为空，则从 LRU 链表 Old Sublist 尾部淘汰一个最久未使用的页 (如果该页是脏页，需要先将其刷新到磁盘)。
3. c. 将磁盘上的数据页读取到获取的帧中。
4. d. 将新读取的页根据中点插入策略添加到 LRU 链表 Old Sublist 的头部。
5. e. 返回 Buffer Pool 中新加载的页。

这里实际操作的都是装着数据页的帧

修改数据页 (更新操作):
- 当需要修改某个数据页时，首先在 Buffer Pool 中找到该页 (如果不存在则先读取)。
- 在 Buffer Pool 中修改页面的副本。
- 将修改后的页标记为 脏页 (Dirty Page)，并添加到 Flush 链表。
- 脏页不会立即刷新到磁盘，而是由后台线程 (Page Cleaner 线程) 异步地刷新到磁盘，以提高性能。

“副本” 指的是 内存中的页是磁盘页的副本

2.4. Page Cleaner 线程 (后台刷新脏页)

Page Cleaner 线程负责将 Buffer Pool 中的脏页刷回到磁盘，主要目的是：

释放 Buffer Pool 空间: 为新的数据页腾出空间。
检查点 (Checkpoint) 操作: 定期将脏页刷新到磁盘，保证数据的一致性和持久性，加速数据库崩溃恢复。
减少用户线程的 I/O 压力: 将磁盘 I/O 操作转移到后台，避免用户线程等待磁盘 I/O。

Page Cleaner 线程的数量由 innodb_page_cleaners 参数控制，默认为 4。

刷脏策略: Page Cleaner 线程的刷脏速度会根据 Redo Log 的生成速率动态调整，以保证 Redo Log 不会被写满，同时尽量减少不必要的 I/O 压力。刷脏速度的计算可以简化理解为：

def flush_dirty_pages():
    while True:
        # 根据redo日志生成速率动态调整
        flush_rate = log_lsn_rate * 0.75 / checkpoint_age
        # 异步IO提交刷盘请求
        os_aio_submit(flush_list.pages[:flush_rate])
        sleep(1000)  # 每秒调度一次

Page Cleaner 线程的任务分配：

当配置了多个 Page Cleaner 线程 (通过 innodb_page_cleaners) 时，这些线程之间是 协同工作，共同负