InnoDB 缓存池

最新推荐文章于 2023-01-04 22:29:19 发布

杏仁技术站

最新推荐文章于 2023-01-04 22:29:19 发布

阅读量273

点赞数

作者 | 王亚楠

Hello, World!

将我们需要的数据从访问速度比较慢的设备中，转移到访问比较快的设备里。

注：对 L2 和 L3 的访问速度估算来自互联网。内存的访问速度还需要考虑总线的速度和带宽。

通过innodb_buffer_pool_size配置项，可以指定缓存池的大小。Mysql在启动时得到的只是映射自内存的虚拟地址，只有在真正加载数据页的时候，才会真正分配。

注：这里涉及到虚拟内存的问题，从操作系统角度看，内存的相关操作都是基于虚拟内存地址的。

一般来说，Buffer Pool中的缓存页和数据页是一一对应的。

默认情况下，磁盘存储的数据页大小为16KB。对于Buffer Pool中的数据页通常叫做缓存页，而Buffer Pool在默认情况下，一个缓存页和一个磁盘上的数据页都是一一对应的。

每一个缓存页都会有一个相对应的描述文件。

描述文件中存储着缓存页的表空间，数据页编号，在 Buffer Pool 中的地址等信息。Buffer Pool中，描述文件会在缓存页面之前。描述数据的大小是缓存页大小的5%左右，所以我们Buffer Pool实际占用的内存空间会比申请的稍大一些。

我们会对数据库进行很多 CRUD 操作，这些操作可能会导致数据页加载入缓存，可能导致数据更新，也可能导致缓存池满了，这些情况下InnoDB如何知晓还有没有缓存空闲，哪些数据被更新了，哪些数据页可以被淘汰？

InnoDB使用一个双向链表追踪空闲的缓存空间。

节点说明 base_node是Free链表的起点，head和tail分别指向这个链表中的首尾描述数据每个空闲的描述数据都会维护一个pre和next指针，分别指向上一个和下一个空闲的描述数据 base_node中维护了一个当前可用的空闲总数。

如果缓存中的数据有变更，我们就称缓存页是一个脏页。脏页需要被不定时的刷新回磁盘，InnoDB 是通过一个Flush的链表跟踪脏页。和Free链表类似。

缓存命中率

Mysql的缓存池大小是有限的，不能一直往缓存池里添加数据。当我们缓存不够用的时候，应该淘汰那些缓存命中率低的数据页。InnoDB是通过一个LRU（Least Rencentyly Userd）链表来区别每个缓存页的命中率的。

普通的 LRU 链表类似 Free 链表

LRU 链表除了空闲页，其它页都会在这个链表中某个数据页被访问之后，会被插入到链表的头部如果需要淘汰数据页，从尾部开始进行淘汰。

预读带来的问题 Mysql有预读机制，我们访问一个数据页的时候，在某些场景下，会把这个数据页相邻的数据页也加载到缓存中，此时有些数据页是不会被访问的，但是被插入到了 LRU 链表的首部，这是不科学的。
频繁访问的数据页被淘汰的问题假如有一个全表扫描的查询，数据量比较大，直接占满了内存，此时会导致LRU链表中的数据全部被淘汰，包括那些被频繁访问的数据库。