为什么要有区?
B+树中每个结点对应一个页,每层之间的页和页之间是通过双向链表相连的,但这只是逻辑上的相连,在磁盘中可能这两个页之间相距很远。而当我们进行范围查询的时候,会先找到最左边的记录和最右边的记录,然后开始遍历查找,当最左边的记录和最后边的记录在物理磁盘上的地址相差很大的时候,此时就会产生随机IO
,而磁盘IO所消耗的时间和内存级别查询所消耗的时间可不要是一个数量级的,相差很大,所以我们应该尽量让在逻辑上相邻的页在磁盘上页相邻,那么我们在进行范围查找的时候就会产生顺序IO
,顺序IO很快的
一个区包含连续的64个页,在innodb存储引擎中,一个页的大小为16kb,所以一个区的大小为1M,在表的数据量很大的时候,就不会在按照页为单位来存储索引数据了,而是按照区为单位存储,甚至当存储的数据量特别大的时候,可能一次性会会分配多个连续的区来存储索引数据,虽然会造成一点点空间浪费(数据不足以填充满整个区),但从性能的角度看,可以消除很多随机IO,功大于过