索引的本质
给数据库的数据排序,每次查询时能按照条件快速找到目标数据。
b-tree树
叶子节点具有相同的深度,并且叶子节点的指针为空;
每个节点存储着key-value,所有索引不重复;
索引从左到右依次递增;
b+tree树
只有叶子节点存储着key-value,其余节点存储着key;
叶子节点包含所有索引;
叶子节点之间用指针连接,提高区间的访问性能;
为什么MySQL用B+树而不用B树呢?
因为B树不管叶子节点还是非叶子节点,都会保存数据,这样导致在非叶子节点中能保存的指针数量变少(有些资料也称为扇出),指针少的情况下要保存大量数据,只能增加树的高度,导致IO 操作变多,查询性能变低。
总结:
B+树叶子和非叶子结点的数据页都是16k,且数据结构一致,区别在于叶子节点放的是真实的行数据,而非叶子结点放的是主键和下一个页的地址。
B+树一般有两到三层,由于其高扇出,三层就能支持2kw以上的数据,且一次查询最多1~3次磁盘IO,性能也还行。
存储同样量级的数据,B树比B+树层级更高,因此磁盘IO也更多,所以B+树更适合成为mysql索引。
索引结构不会影响单表最大行数,2kw也只是推荐值,超过了这个值可能会导致B+树层级更高,影响查询性能。
单表最大值还受主键大小和磁盘大小限制。
MyISAM存储引擎索引实现
非聚簇索引:索引文件和数据文件是分开存储的。
InnoDB索引实现
聚集索引:索引和数据是一致的,所以必须要主键。
采用了b+tree树结构存储,叶子节点中包含了所有索引和数据。
最左匹配原则
联合索引需要从左到右依次匹配列。