平时在执行crud的时候,都会从磁盘上加载数据页到Buffer Pool的缓存页里去,然后更新了缓存页后,又会刷新回磁盘上的数据页里去。所以其实MySQL中进行数据操作的最小单位应该是数据页。
每个数据页,实际上是默认有16kb的大小,那么这16kb的大小就是存放大量的数据行吗?
明显不是的,其实一个数据页拆分成了很多个部分,大体上来说包含了文件头、数据页头、最小记录和最大记录、多个数据行、空闲空间、数据页目录、文件尾部。具体如下图所示:
其中文件头占据了38个字节,数据页头占据了56个字节,最大记录和最小记录占据了26个字节,数据行区域的大小是不固定的,空闲区域的大小也是不固定的,数据页目录的大小也是不固定的,然后文件尾部占据8个字节。
通过这种特殊的存储格式在磁盘文件里去存放一个又一个的数据页,每个数据页在磁盘里实际存储的时候,就是包含了上述一些特殊的数据,然后每个数据页里还有专门的区域包含了多个数据行。
假设现在要插入一行数据,此时数据库里可是一行数据都没有的,那么此时是不是应该先是从磁盘上加载一个空的数据页到缓存页里去?
此时空的数据页就是如上图所示,至于加载的过程,则如下图所示:
缓存页跟数据页是一 一对应的,它在磁盘上的时候就是数据页,数据页加载到缓存页里了,就叫它缓存页了!
所以此时在缓存页里插入一条数据,实际上就是在数据行那个区域里插入一行数据,然后空闲区域的空间会减少一些,此时当缓存页里插入了一行数据之后,其实缓存页此时看起来如下图所示:
接着就可以不停的插入数据到这个缓存页里去,直到它的空闲区域都耗尽了,就是这个页满了,此时数据行区域内可能有很多行数据,如下图所示,空闲区域就没了:
在更新缓存页的同时,其实它在lru链表里的位置会不停的变动,而且肯定会在flush链表里,所以最终它一定会通过后台IO线程根据lru链表和flush链表,把这个脏的缓存页刷到磁盘上去,如下图所示:
因此对于数据页的整体存储结构的初步介绍,以及MySQL实际运行过程中,数据页的使用,就介绍完了。