MySQL_数据页、b+树索引

来日可期Dream

已于 2022-07-25 09:15:19 修改

阅读量526

点赞数

分类专栏： Mysql 文章标签： mysql b树数据库

于 2022-07-22 15:19:32 首次发布

本文链接：https://blog.csdn.net/Dream__Y/article/details/125914779

版权

Mysql 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

InnoDB记录存储结构
InnoDB数据页结构
B+树索引
B+树索引的使用

InnoDB记录存储结构

除InnoDB以外的常用引擎,还有MyISAM

页是磁盘和内存中交互的基本单位,也是存储空间的基本单位,默认大小为16kb

COMPACT行格式:

请添加图片描述
记录的额外信息:变长字段长度列表、NULL值列表、记录信息;

变长字段列表:(如varchar等)因存储多少字节的数据是不固定的,所以分为两部分:真正的数据、占用的字节数

按照列的顺序逆序存放最大存储数M * 占用字节数W <= 255, 则使用1字节表示占用的字节数,其中若>255, 若实际占用的<=127则还用1字节,否则2字节.
InnoDB读取记录时候先看表结构,入欧工允许存储的最大字节数部大雨255可以认为只是用1字节来表示真是数据占用的字节数

NULL值列表:首先统计允许存储NULL的列有哪些,若没有则NULL值列表页不存在了

REDUNDANT行格式:

请添加图片描述

5.0之前的了

DYNAMIC和COMPRESSED行格式

类似于COMPACT行格式,不过处理溢出时的决策不同,不是只把溢出的数据放到原先的溢出页中了,而是直接将所有的数据存储在溢出页,然后直接指向地址,另外COMPRESSED回采用压缩算法对页面进行压缩.

InnoDB数据页结构

页的结构图:
请添加图片描述

一开始生成页的时候,没有User Records的部分,每当插入一条记录时,会从Free Space中申请一个记录大小的空间,并分配.

记录头:
请添加图片描述
其中
n_owned是带头大哥记录的是该组中所有的记录条数，小弟记录的都为0。
next_record代表从当前记录的真实数据到下一条记录的真实数据，正数代表在后面，附属代表在前面(按主键值排序)，而且想做读取就是记录头信息，向右读区是真实数据。
Supremum主键值最大的用户记录的下一条记录
Infimum记录的下一条记录是主键值最小的用户记录

变长字段长度列表、NULL值列表中的信息逆序存放的原因：
可以是使得记录中位置靠前的字段和他们对应的字段长度信息在内存中的距离更近，这可能会提高高速缓存的命中率。

Page Directory页目录

1、将所有的有效正常记录（包括Infimum和Supremum）划分为几个组
2、每个组的最后一条记录计为“带头大哥”
3、每个组最后一条数据的地址偏移量单独提取出来，按顺序存储到靠页尾部的地方，这个地方就是页目录。并且将之称为槽（slot），占用2字节

Infimum记录所在分组只能有1条记录
Supremum记录的所在的分组只能在1-8条
剩下的记录范围只能是4-8条

步骤：1.只有两个槽Infi，Supre 2.找到比插入大但差值最小的记录，槽对应的n_owned+1
3.记录数为8后，再插入时拆分成两个组，一个4一个5，新增槽，记录最大的记录的偏移量

采用二分法快速寻找槽

PageHeader页面头部

描述记录的状态信息
页面头部信息

File Header文件头部

通用于各种类型的页，都会将其作为第一个组成部分，描述通用于各种页的信息。
请添加图片描述
其中：
FIL_PAGE_SPACE_OR_CHKSUM：相当于当前页面的校验和。
FIL_PAGE_OFFSET：页号，通过它定位一个页
FILE_PAGE_TYPE：页的类型

以下的开头前缀都是FIL_PAGE_
TYPE_ALLOCATED 最新分配没使用
UNDO_LOG undo日志页
INODE 存储段的信息
IBUF_FREE_LIST Change Buffer空闲列表
IBUF_BITMAP Change Buffer的一些属性
TYPE_SYS 系统数据
TYPE_TRX_SYS 事务系统数据
TYPE_FSP_HDR 表空间头部信息
TYPE_XDES 存储区的一些信息
TYPE_BLOB 溢出页
INDEX 索引页即数据页。可以组成一个双向链表

File Trailer 文件尾部

File Trailer由8个字节组成，可以分成2个小部分

前4个字节代表校验和，与File Header中的校验和对应。每次页面在内存中修改时，刷新之前将校验和算出来，File Header会首先刷新到磁盘中，然后校验和也会被写到页的尾部，若刷新成功那么校验和是一致的，不同则错误
对应最后修改时的LSN的后4个字节（日志序列号）与Header中的FIL_PAGE_LSN后4哥字节相同，用于完整性。