Mysql缓存-全表扫描过程、LRU算法

最新推荐文章于 2024-03-14 22:10:49 发布

栽经

最新推荐文章于 2024-03-14 22:10:49 发布

阅读量1k

点赞数

分类专栏： mysql

原文链接：https://time.geekbang.org/column/intro/139

版权

mysql 专栏收录该内容

17 篇文章 1 订阅

订阅专栏

在日常开发中，常因为分页查询的使用，或者SQL的语法问题导致的全表扫描，这带来的问题可能会有系统的OOM，频繁的GC，以及慢SQL，数据返回慢等问题。那么我们如果光从内存这个角度看这个全表扫描的问题，他是怎么样进行查询返回结果的呢？

假设我的主机内存就几个G，但是全表的数据可能是它的几倍，那么机器的内存会直接用光吗？

结合日常的开发工作，对大表做全表扫描，看来应该是没问题的(只看数据而言)。但是，这个流程到底是怎么样的呢？

一个查询语句的状态变化

MySQL查询语句进入执行阶段后，首先把状态设置成“Sending data”；
然后，发送执行结果的列相关的信息（meta data) 给客户端；
再继续执行语句的流程；
执行完成后，把状态设置成空字符串。
仅当一个线程处于“等待客户端接收结果”的状态，才会显示"Sending to client"；而如果显示成“Sending data”，它的意思只是“正在执行”。

net_buffer_length

这部分用来存放客户端连接线程的连接信息和返回客户端的结果集。当 MySQL 开始产生可以返回的结果集，会在通过网络返回给客户端请求线程之前，会先暂存在通过 net_buffer_length 所设置的缓冲区中，等满足一定大小的时候才开始向客户端发送，以提高网络传输效率。不过，net_buffer_length 参数所设置的仅仅只是该缓存区的初始化大小，MySQL 会根据实际需要自行申请更多的内存以满足需求，但最大不会超过 max_allowed_packet(可以在config修改) 参数大小。

“结果集”存在哪里呢？

InnoDB的数据是保存在主键索引上的，所以全表扫描实际上是直接扫描表t的主键索引。
这条查询语句由于没有其他的判断条件，所以查到的每一行都可以直接放到结果集里面，然后返回给客户端。

实际上，服务端并不需要保存一个完整的结果集。取数据和发数据的流程是这样的：
1.获取一行，写到net_buffer中。这块内存的大小是由参数net_buffer_length定义的，默认是16k(数据库的读取是按页的)。
2.重复获取行，直到net_buffer写满，调用网络接口发出去。
3.如果发送成功，就清空net_buffer，然后继续取下一行，并写入net_buffer。
4.如果发送函数返回EAGAIN或WSAEWOULDBLOCK，就表示本地网络栈（socket send buffer）写满了，进入等待。直到网络栈重新可写，再继续发送。
5.客户端去读 socket receive buffer 的内容，不堵塞的话，socket send buffer 就会继续把数据发送给 socket receive buffer (服务端的网络栈) 。

这个流程中，你可以看到：
1.一个查询在发送过程中，占用的MySQL内部的内存最大就是net_buffer_length这么大，并不会达到全表数据的大小；
2socket send buffer 也不可能达到最大值（默认定义/proc/sys/net/core/wmem_default），如果socket send buffer被写满，就会暂停读数据的流程。

MySQL是“边读边发的”，意味着，如果客户端接收得慢，会导致MySQL服务端由于结果发不出去，这个事务的执行时间变长。

故意让客户端不去读socket receive buffer中的内容，然后在服务端show processlist看到的结果。
在这里插入图片描述
如果看到State的值一直处于“Sending to client”，就表示服务器端的网络栈写满了。

全表扫描对InnoDB的影响

内存的数据页是在Buffer Pool 中管理的，在WAL里Buffer Pool 起到了加速更新的作用。而实际上，Buffer Pool 还有一个更重要的作用，就是加速查询。
由于有WAL机制，当事务提交的时候，磁盘上的数据页是旧的，那如果这时候马上有一个查询要来读这个数据页，是不是要马上把redo log应用到数据页呢？
答案是不需要。因为这时候内存数据页的结果是最新的，直接读内存页就可以了。这时候查询根本不需要读磁盘，直接从内存拿结果，速度是很快的。
而Buffer Pool对查询的加速效果，依赖于一个重要的指标，即：内存命中率。
InnoDB Buffer Pool的大小是由参数 innodb_buffer_pool_size确定的，一般建议设置成可用物理内存的60%~80%。
innodb_buffer_pool_size小于磁盘的数据量是很常见的。如果一个 Buffer Pool满了，而又要从磁盘读入一个数据页，那肯定是要淘汰一个旧数据页的。

InnoDB改进的LRU算法

InnoDB内存管理用的是最近最少使用 (Least Recently Used, LRU)算法，这个算法的核心就是淘汰最久未使用的数据。

InnoDB管理Buffer Pool的LRU算法，是用链表来实现的。

正常的LRU算法(假设内存里只能放下这么多数据页):

1.链表头部是最近刚刚被访问过的数据页P1
2.这时候有一个读请求访问P2,P2被移到最前面；
3.如果这次访问的数据页是不存在于链表中的，所以需要在Buffer Pool中新申请一个数据页Px，加到链表头部。但是由于内存已经满了，不能申请新的内存。于是，会清空链表末尾Pm这个数据页的内存，存入Px的内容，然后放到链表头部。
4.从效果上看，就是最久没有被访问的数据页Pm，被淘汰了。

如果要做一个全表扫描，按正常的LRU算法会不会有问题呢？

按照这个算法扫描的话，就会把当前的Buffer Pool里的数据全部淘汰掉，存入扫描过程中访问到的数据页的内容。也就是说Buffer Pool里面主要放的是这个表的缓存数据。
对于一个正在做业务服务的库，Buffer Pool的内存命中率急剧下降，磁盘压力增加，SQL语句响应变慢。

改进后的LRU算法:
在这里插入图片描述
在InnoDB实现上，按照5:3的比例把整个LRU链表分成了young区域和old区域。图中LRU_old指向的就是old区域的第一个位置，是整个链表的5/8处。也就是说，靠近链表头部的5/8是young区域，靠近链表尾部的3/8是old区域。
新流程:
1.要访问数据页P3，由于P3在young区域，因此和优化前的LRU算法一样，将其移到链表头部，变成状态2。
2.之后要访问一个新的不存在于当前链表的数据页，这时候依然是淘汰掉数据页Pm，但是新插入的数据页Px，是放在LRU_old处。
3.处于old区域的数据页，每次被访问的时候都要做下面这个判断：
若这个数据页在LRU链表中存在的时间超过了1秒，就把它移动到链表头部；
如果这个数据页在LRU链表中存在的时间短于1秒，位置保持不变。1秒这个时间，是由参数innodb_old_blocks_time控制的。其默认值是1000，单位毫秒。

如果要做一个全表扫描，按改进的LRU算法会怎样？

改进后的LRU算法的操作逻辑：
1.扫描过程中，需要新插入的数据页，都被放到old区域;
2.一个数据页里面有多条记录，这个数据页会被多次访问到，但由于是顺序扫描，这个数据页第一次被访问和最后一次被访问的时间间隔不会超过1秒，因此还是会被保留在old区域；
3.再继续扫描后续的数据，之前的这个数据页之后也不会再被访问到，于是始终没有机会移到链表头部（也就是young区域），很快就会被淘汰出去。

这个策略最大的收益，就是在扫描这个大表的过程中，虽然也用到了Buffer Pool，但是对young区域完全没有影响，从而保证了Buffer Pool响应正常业务的查询命中率。

[资料来源]
1.Mysql实战45讲-丁奇

栽经

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Mysql缓存-全表扫描过程、LRU算法

在日常开发中，常因为分页查询的使用，或者SQL的语法问题导致的全表扫描，这带来的问题可能会有系统的OOM，或者频繁的GC，以及慢SQL，数据返回慢等问题。那么我们如果光从内存这个角度看这个全表扫描的问题，他是怎么样进行查询返回结果的呢？假设我的主机内存就几个G，但是全表的数据可能是它的几倍，那么机器的内存会直接用光吗？结合日常的开发工作，对大表做全表扫描，看来应该是没问题的(只看数据而言)。但...
复制链接

扫一扫