B-tree Node其实就是数据页。
数据页的组成
InnoDB的数据页由7个部分组成
- File Header(文件头,固定38字节)
- Page Header(页头 固定56字节)
- Infimun和Supremum Records
- User Records(行记录)
- Free Space(空闲空间)
- Page Directory(页目录)
- File Trailer(文件结尾信息 固定8字节)
这几个部分,除了文件头、页头和文件结尾信息之外(页的固定信息),其他都是不固定大小的,也就是说是动态变化的。
InnoDB存储引擎数据页结构如下图所示
File Header
File Header虽然名字为文件头,但它是用来记录页的一些头信息,这里又由八部分组成,共占38个字节
- Fil_page_space_or_chksum:代表页的checksum值(一种全新的checkSum值),旧版本是使用这个属性去标识属于哪个表空间的
- Fil_page_offset:标识该页在对应表空间的偏移值,用来定位从表空间哪个位置开始属于该页
- Fil_page_prev:记录该页的上一个页的地址
- Fil_page_next:记录该页的下一个页的地址 (有上一个页又有下一个页,证明叶子结点形成的是双向链表)
- Fil_page_lsn:该值代表该页最后被修改的日志序列位置LSN(Log Sequencr Number)
- Fil_page_type:标识该存储页的类型
- Fil_page_file_plush_lsn:该值仅仅出现在系统表空间的页,对于独立表空间的页都为0
- Fil_page_arch_log_no_or_space_id:代表该页属于哪个表空间
下面介绍一些InnoDB存储引擎中页的类型
名称 | 十六进制 | 解释 |
---|---|---|
FIL_PAGE_INDEX | 0x458F | B+树的叶子结点 |
FIL_PAGE_UNDO_LOG | 0X0002 | Undo Log页 |
FIL_PAGE_INODE | 0X0003 | 索引结点(B+树的内部结点) |
FIL_PAGE_IBUF_FREE_LIST | 0X0004 | Insert Buffer空闲列表 |
FIL_PAGE_TYPE_ALLOCATED | 0X0000 | 最新分配的页 |
FIL_PAGE_IBUF_BITMAP | 0x0005 | Insert Buffer位图 |
FIL_PAGE_TYPE_SYS | 0x0006 | 系统页 |
FIL_PAGE_TYPE_TRX_SYS | 0x0007 | 事务系统数据 |
FIL_PAGE_TYPE_FSP_HDR | 0x0008 | File Space Header |
FIL_PAGE_TYPE_XDES | 0x0009 | 扩展描述页 |
FLI_PAGE_TYPE_BLOB | 0x000A | BLOB页(前面提到的溢出页) |
Page Header
File Header(文件头)后就是Page Header(页头)
Page Header是用来记录数据页的状态信息的,由14个部分组成,共占56个字节
名称 | 大小 | 说明 |
---|---|---|
Page_n_dir_slots | 2 | 在页目录(Page Directory)中的槽数,后面再说 |
Page_heap_top | 2 | 堆中第一个记录的指针,行记录在页中是使用堆形式存放的,也就是说,该属性是堆的根结点 |
page_n_heap | 2 | 堆中的记录数,占用2个字节,也就是16位,比较特殊的一点就是该属性的第15位记录的是行的格式 |
page_free | 2 | 指向堆中可重用空间的指针 |
page_garbage | 2 | 已经删除记录数,通过统计行记录中的记录头信息段的deleted_flag |
page_last_insert | 2 | 指向往堆中最后插入的位置 |
page_direction | 2 | 指向最后往堆中插入的方向 |
page_n_direction | 2 | 一个方向连续插入记录的数量 |
page_n_recs | 2 | 该页中记录的数量 |
page_max_trx_id | 8 | 对该页进行修改的所有事务里面最大的事务ID,该值仅在非聚集索引中定义 |
page_level | 2 | 记录当前页在索引B+树上的位置,如果为0x00代表叶子结点 |
page_index_id | 8 | 索引ID,表示当前页是属于哪个索引的 |
page_btr_seg_leaf | 10 | B+树非叶子结点数据页所在段的segment header |
page_btr_seg_top | 10 | B+树叶子结点数据页所在段的segment header |
Infimum和Supremum Record
Infimum和Supremum Record是InnoDB数据页自带的两个虚拟的行记录,用来限定行记录的边界。
Infimum记录是比该页中的任何行数据的主键值都要小的值,而Supremum Record是比页中任何行数据的主键值都要大的值,这两者占用的字节数都各不相同。(主键其实就是聚集索引)
而页中存储行数据是使用堆,所以Infimum肯定在最下层的最左边,而Supremum Record肯定在最下层的最右边
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ANWH0bxZ-1619747219072)(C:\Users\111\AppData\Roaming\Typora\typora-user-images\image-20210429230006938.png)]
User Record和Free Space
User Record就是之前讨论的实际存储行记录的内容。
Free Space是指空闲空间,这个同样也是一个链表结构,在一条记录被删除之后,该空间就会加入到该空闲空间的链表中
Page Directory
Page Directory中存放了所有行记录在页中的相对位置,B+树索引的叶子结点只是存放了页的位置,真正找到记录需要根据Page Directory去进行,这些Page Directory里面的记录指针称为Slots(槽),或者目录槽,但这里要注意的是,并不是一个槽就代表一条记录,一个槽里面可能有多条记录,当记录被插入或者删除的时候是需要对槽进行维护的。
槽里面的行记录是有顺序的,根据索引键值顺序存放,所以是可以利用二叉查找迅速找到记录的指针,但这里又要注意的是,查找的时候不止一条数据,而二叉查找可能找到一个粗略结果,此时就会根据行记录里面recocder head部分的next_record属性找到下一条行记录,同时Page Directory也解释了recorder head部分的n_owned属性,用来便于在该页进行查找记录。
要注意的是,B+树索引只是让我们可以快速找到页,此时将页加载进缓冲池,然后再通过Page Directory去进行查找对应的行记录
File Trailer
File Trailer是为了检测页完整地被写入进了数据库而设置的,File Trailer里面只有一个File_page_end_lsn部分,这个部分占用8个字节,前4字节代表该页的checksum值(但并不相同,需要使用函数运算),也就是File Header里面的Fil_page_space_or_chksum,后面的4字节和File Header中的Fil_page_lsn相同,然后对比的时候就对比File Header和File Trailer对应的属性是否一致即可,用此来保证页的完整性
在默认配置下,InnoDB每去从磁盘中读取一个页时,就会去检测该页的完整性,即是否发生Corrupt。
可以通过innodb_checksum_algorithm去看是否开启了验证和使用的对比算法。