INNODB引擎
1、表空间:表创建后,会生成两个文件,.frm和.ibd (INNODB)
frm:表结构定义文件
ibd:表空间文件,存储数据和索引
2、段(SEGMENT),多个区组成,相当于表
3、区(EXTENT),一个区由64页组成,大小也就是64x16k=1M
4、页(PAGE),也叫数据块,多个行记录组成,用户数据都存储在页中,每个页大小默认为16k,若一行数据就达到16k,那此页只有一条数据,若行数据大小16K,会将溢出数据存储到溢出页中,也就是所谓的页溢出off-page
Page页可划分下面几种结构
下面分别介绍一下page页中各个组成部分的含义。
-
File Header:文件头信息,比较重要的信息有
FIL_PAGE_PREV
记录上一个page页和FIL_PAGE_NEXT
下一个page页的位置信息,通过这两个信息,可以让所有的page页面组成一个双向链表:关于文件头File Header更为详细的内容参考如下图:
-
Page Header:记录本页存储记录的状态信息,比如本页记录数量,槽数量,详细的信息参考下图:
-
Infimun + Supermum Records:最小行与最大行记录,是虚拟记录,标记该page页中,存储的id最大的行和id最小的行记录。具体可以参考如下图的结构:
-
User Records:用户真正的数据存储区域,这里真正存放用户的行数据,它占据了整个page页的大部分空间。以单链表的形式存储一条条行记录。如下图所示,他们在物理上不一定是有序的,可能刚开始是有序的,但是随着增删改的操作可能就无序了,但是在逻辑上是有序的:
一个page页中的多行记录,再结合多个page页,就形成如下的存储结构:页与页直接是双向链表,页内的行记录直接是单向链表。如下所示:page页中的每一个箭头可以理解为一行数据。
-
Free Space:存数据空间中尚未使用的区域,该页中剩余的空间,用于存放后续插入的数据。
-
Page Directory:页目录,页中某些记录的相对位置,用于提升查询效率。我们要在一个页中查找指定的一条记录。除了从头遍历还有更高效率的方法么?Page Directory提供了解决方案。
InnoDB会将一个页中的所有记录划分成若干个组,每组4-8个记录。将每个组最后一个记录相对于第一个记录的地址偏移量(可以定位到真实数据记录,这里指的都是主键的值)提取出来存放在页中一个叫做
Page Directory
的数组中,数组中的元素就是这些地址偏移量,也称为槽(slot)。所以Page Directory就是由槽组成的。所以在一个页中根据主键查找记录是很快的,步骤为:
- 二分法确定该记录所在的槽,并找到该槽所在分组中主键值最小的那条记录。
- 通过next_record属性遍历单链表找到记录
注意:二分法,适用于数组。
链表是顺序存取,不是随机存取,用二分查找并不能提高查找效率,因为你每次还得从第一个结点出发,找到指针LOW,HIGH,MIDDLE所指的元素,所以一般不在链表内使用二分查找。
-
File Trailer:文件尾,刷盘时校验页是否完整。详细内参考下图:
转发自:https://blog.csdn.net/javaanddonet/article/details/111992640