问题:
在 实验 05 中,我们看到了内部临时表会使用到不少内存。
那么如果需要的临时表再大一些,必然要使用到磁盘来承载,那么内部临时表是何时使用磁盘的?
实验:
我们仍使用 实验 05 中的环境,略去准备数据的过程。
我们仍然使用两个会话,一个会话 run,用于运行主 SQL;另一个会话 ps,用于进行 performance_schema 的观察:
主会话线程号为 29,
![41054d419bb41c32e7b83c5f1c5e6ced.png](https://img-blog.csdnimg.cn/img_convert/41054d419bb41c32e7b83c5f1c5e6ced.png)
将 performance_schema 中的统计量重置,
![fdff564e8d06cedae5a4606e4a4188f7.png](https://img-blog.csdnimg.cn/img_convert/fdff564e8d06cedae5a4606e4a4188f7.png)
临时表的表大小限制取决于参数 tmp_table_size 和 max_heap_table_size 中较小者,我们实验中以设置 max_heap_table_size 为例。
我们将会话级别的临时表大小设置为 2M(小于上次实验中临时表使用的空间),执行使用临时表的 SQL:
![1202a3cff223e378b5f1de7a2f90d230.png](https://img-blog.csdnimg.cn/img_convert/1202a3cff223e378b5f1de7a2f90d230.png)
查看内存的分配记录:
![b2d0083162bdca1be45dd934c23c01e2.png](https://img-blog.csdnimg.cn/img_convert/b2d0083162bdca1be45dd934c23c01e2.png)
会发现内存分配略大于 2M,我们猜测临时表会比配置略多一点消耗,可以忽略。
查看语句的特征值:
![3f8e778c859a515f17a49be17e45ceee.png](https://img-blog.csdnimg.cn/img_convert/3f8e778c859a515f17a49be17e45ceee.png)
可以看到语句使用了一次需要落磁盘的临时表。
那么这张临时表用了多少的磁盘呢?
我们开启 performance_schema 中 waits 相关的统计项:
![d074490ab9c25c0cf1599d1ef00606aa.png](https://img-blog.csdnimg.cn/img_convert/d074490ab9c25c0cf1599d1ef00606aa.png)
重做实验,略过。
再查看 performance_schema 的统计值:
![0ca52f1afe7c849f4b95492c565d74fb.png](https://img-blog.csdnimg.cn/img_convert/0ca52f1afe7c849f4b95492c565d74fb.png)
可以看到几个现象:
1. 临时表空间被写入了 7.92MiB 的数据。
2. 这些数据是语句写入后,慢慢逐渐写入的。
来看看这些写入操作的特征,该方法我们在 实验 03 使用过:
![25d61918a85eddad6386990b06703776.png](https://img-blog.csdnimg.cn/img_convert/25d61918a85eddad6386990b06703776.png)
可以看到写入的线程是 page_clean_thread,是一个刷脏操作,这样就能理解数据为什么是慢慢写入的。
也可以看到每个 IO 操作的大小是 16K,也就是刷数据页的操作。
结论:
我们可以看到,
1. MySQL 会基本遵守 max_heap_table_size 的设定,在内存不够用时,直接将表转到磁盘上存储。
2. 由于引擎不同(内存中表引擎为 heap,磁盘中表引擎则跟随 internal_tmp_disk_storage_engine 的配置),本次实验写磁盘的数据量和 实验 05 中使用内存的数据量不同。
3. 如果临时表要使用磁盘,表引擎配置为 InnoDB,那么即使临时表在一个时间很短的 SQL 中使用,且使用后即释放,释放后也会刷脏页到磁盘中,消耗部分 IO。