InnoDB页结构浅析
译者:杨万富
InnoDB
将所有的记录存放在数据库页中(也可以称为数据块)。一般情况下,所有的页大小都是
16KB
。
数据页中不仅仅包含实际的记录,还包含其它的一些内容,比如文件头以及文件尾等等。
InnoDB
的页包含以下几个部分:
1)
Fil Header
:文件头
2)
Page Header
:页头
3)
Infimum+Supremum Records
:最小虚记录以及最大虚记录
4)
User Records
:用户记录
5)
Free Space
:自由堆
6)
Page Directory
:目录槽
7)
Fil Trailer
:文件尾
从这几个部分,我们可以看到。页中的
2
与
6
是与页管理有关,页中的
1
和
7
与文件管理有关。其中的
3
、
4
、
5
是记录相关的。每个页一旦分配,一定具有最小虚记录与最大虚记录,可以分别想像成无穷小、无穷大。当用户插入一条记录,就会从
5
(自由堆)中分配一块空间用来存储该记录。
1 Fil Header(文件头)
文件头由
8
个部分组成,见表
1
:
表
1
:
文件头的组织形式
名称
|
长度
|
含义
|
FIL_PAGE_SPACE
|
4
|
space id
|
FIL_PAGE_OFFSET
|
4
|
页号
|
FIL_PAGE_PREV
|
4
|
上一页
|
FIL_PAGE_NEXT
|
4
|
下一页
|
FIL_PAGE_LSN
|
8
|
日志序列号
|
FIL_PAGE_TYPE
|
2
|
页类型
|
FIL_PAGE_FILE_FLUSH_LSN
|
8
|
文件的日志序列号,仅文件的第一页的此字段有效
|
FIL_PAGE_ARCH_LOG_NO
|
4
|
归档日志文件号
|
2 Page Header(页头)
页头由
14
个部分组成,见表
2
:
表
2
:文件头的组织形式
名称
|
长度
|
含义
|
PAGE_N_DIR_SLOTS
|
2
|
记录槽的数量,初始值为
2
,因为页至少具有最小虚记录与最大虚记录
|
PAGE_HEAP_TOP
|
2
|
指向堆中的第一条记录
|
PAGE_N_HEAP
|
2
|
堆记录的数量,初始值为
2
|
PAGE_N_FREE
|
2
|
指向第一个空闲记录
|
PAGE_GARBAGE
|
2
|
被删除记录的总字节数
|
PAGE_LAST_INSERT
|
2
|
指向最后一个插入的记录
|
PAGE_DIRECTION
|
2
|
记录顺序
|
PAGE_N_DIRECTION
|
2
|
连续同方面插入的数量
|
PAGE_N_RECS
|
2
|
用户记录的数量
|
PAGE_MAX_TRX_ID
|
8
|
更改此页的最高事务
ID
(仅仅对二级索引有效)
|
PAGE_LEVEL
|
2
|
该页在索引中的层次(页节点是
0
)
|
PAGE_INDEX_ID
|
8
|
所属的索引
ID
|
PAGE_BTR_SEG_LEAF
|
10
|
索引页节点段
|
PAGE_BTR_SEG_TOP
|
10
|
索引内节点段
|
3 Infimum+Supremum Records(最小虚记录以及最大虚记录)
最小虚拟记录与最大虚拟记录,既是所谓的负无穷大、正无穷大。这两个记录是在页创建时创建的,并且永远不会被删除。它们的作用在于作为查询的屏障,避免越界。
4 User Records(用户记录)
在该区域中,将可以找到所有用户插入的记录。有两种方式来查找用户记录,一种为有序,另外一种为无序。
InnoDB
不会在该区域按照记录进行
B
树的
key
排序(这会导致频繁的数据移动),所以,插入时是直接将新行插入现有行的后面(从自由堆的顶部分配空间),或者使用空闲记录的空间(空闲记录即被删除的记录,记录被删除后,并不立即回收该记录所占的空间)。
但是,
B
树的定义是记录必须按照
key
值进行排序,因此每个记录都含有一个指针
(next
字段
)
指向下一条记录(以
key
值排序)。换句话说,这些记录有一个单向链表。所以,
InnoDB
在查找时可以按照
key
排序的方式进行查找。
5 Free Space(自由堆)
自由堆,可以从该堆上为新记录分配所需空间。
6 Page Directory(目录槽)
和其它数据库不同的是,
InnoDB
并不会为每一个记录分配一个目录。每六个记录分配一个目录。
7 Fil Trailer(文件尾)
文件尾记录的是文件的
LSN
。