1. InnoDB逻辑存储结构
从InnoDB存储引擎的逻辑存储结构看,所有数据都被逻辑地存放在一个空间中,称之为表空间(tablespace),表空间又由段(segment)、区(extent)、页(page)组成,页中又包含行的概念(即一条一条的数据)。页在某些文档中被称之为块(block),InnoDB存储引擎的逻辑结构如下
2. 表空间
表空间是InnoDB存储引擎逻辑结构的最高层,所有的数据都放在表空间中,默认情况下,InnoDB存储引擎有一个共享表空间ibdata1,即所有的数据都放在这个表空间中。
用户可以通过参数innodb_file_per_table
来控制每张表的数据是放在共享表空间中还是放到单独的表空间中。
如果启动了innodb_file_per_table
参数,只会将表的数据,索引和插入缓冲BitMap页存放到单独的表空间中,其他信息,例如回滚(undo),插入缓冲索引页,系统事务信息,二次写缓冲(DOuble write buffer)还是存放于原来的共享表空间内,所以共享表空间还是会不断变大。
共享表空间不会缩小,共享表空间会判断内部的数据是否可用,如果没有用的话就会标记为可用空间,供下次使用。
3. 段
表空间是由各个段组成的,例如数据段,索引段,回滚段等
在InnoDB存储引擎中,对段的管理都是有存储引擎所完成,DBA没有必要对其进行控制,这与Oracle数据库中的自动段空间管理(ASSM)类似,简化了DBA对段的管理。
4. 区
区是由连续页组成的空间,在任何情况下每个区的大小为1M,为了保证区中页的连续性,InnoDB会一次性从磁盘申请4-5个区。默认情况下InnoDB中页的大小为16KB,即默认情况下一个区有64个连续的页。
InnoDB 1.0x版本开始引入压缩页,即每个页的大小可以通过参数KEY_BLOCK_SIZE
自定义页大小,例如2KB,4KB,8KB,因此所对应区的页的梳理为512,256,128.因为区的大小是固定为1M,所以区所对应的页的个数与页大小相关
开启KEY_BLOCK_SIZE
后,每个数据库都有单独的文件夹,文件夹里有自己的表空间
例如进入mybatisplus数据库可以看到对应表的ibd文件
4.1 问题
上述提到InnoDB会一次性从磁盘申请4-5个区,那我创建一个新表testcreatetablesize,观察其大小会发现为96KB,上图所示。一个区的大小为1M,idb文件远远小于1M,这是为什么呢?
这是因为在创建表时会先寻找32个页大小的碎片页(fragment page)来存放数据,使用完了之后才是64个连续页的申请,好处是对于小表或者undo这类的段,开始时申请较少的空间,节省磁盘容量的开销。