B+Tree
-
Mysql没有选择B-Tree的原因
- B-Tree每个结点都保存数据,每个结点的大小有限,这样会导致树的深度变高,从而导致磁盘I/O操作次数增加
- 不能很好的利用操作系统读取磁盘的特性(操作系统每次读取4k的数据,以页为单位)
- 不能很好的利用磁盘的预读能力(操作系统每次读取一页,会提前预读下一页或者下几页)
-
使用B+Tree
- 非叶节点不保存数据相关信息,只保存关键字和子节点的指针,这样每个结点能存的很多关键字和子节点的指针,树的高度相对会变小
- 关键字对应的数据保存在叶子节点中
- 采用的是左闭合区间
- 所有叶子节点之间都有一个双向指针,便于范围和分页查找
-
Mysql B+Tree索引组织表图
-
从上图可以看出,加入每一行数据占用整个数据页(默认数据页大小16KB,能存储最大的数据小于16KB),那么B+Tree将退化为单链表,所以InnoDB规定了一个Page必须包含两行数据。也就是一行数据存储在Page上的大小小于8KB。
数据页
- 页(Page)是InnoDB存储引擎管理数据库的最小磁盘单位。
- 非叶子节点中的数据(User Record)占据Page的大部分空间,User Record由一条条的Record(行数据)组成,在一个单链表的内部,单链表的头尾由两条记录来表示,字符串形式的"Infimum"代表开头,"Supremum"表示结尾;
- User Record内部存储了四种格式的数据:
- 主索引树非叶子节点
- 子节点存储的主键里最小的值,这是B+树必须的,作用是在一个Page里定位到具体的记录的位置
- 最小的值所在的Page的编号,作用是定位到对应的Record所在的Page
- 主索引树叶子节点
- 主键,B+树所必须的,也是数据行的一部分
- 除去主键以外的所有列,这时数据行的除去主键的其他所有列的集合
- 辅助索引树非叶子节点
- 子节点里存储的辅助键值里的最小值,这时B+Tree必须的,作用是在一个Page里定位到具体记录的位置
- 辅助索引树叶子节点
- 辅助索引键值,是B+树必须的
- 主键值,用来在主索引树里在做一次B+树检索来找到整条记录
- 主索引树非叶子节点