目录
前面文章中已经介绍了B-tree与B+tree的底层数据结构,本文介绍下Mysql索引相关内容。
B+tree的优势
- 读写磁盘的能力强
B+tree非叶子节点不保存数据相关信息,只保存关键字和子节点的引用,所以一个节点可以保存更多的关键字( show variables like 'innodb_page_size' mysql页大小),磁盘一次可加载更多的关键字,更容易定位到查询数据。
- 扫表能力强
B+tree关键字对应的数据都保存在叶子节点上,进行全表扫描时,只要遍历叶子节点,无需遍历整棵树。
- 遍历、排序、范围搜索的能力更强
B+Tree叶子节点是顺序排列的,并且相邻节点具有顺序引用的关系,所以对于这种依赖顺序或范围的操作更有优势。
- 检索效率稳定
B+Tree 永远是在叶子节点拿到数据,所以 IO 次数是稳定的。
- 相比于二叉树
1、高度太大
树的高(深)度决定着它的IO操作次数。显然,当数据量逐渐增加时,平衡二叉树的深度也会显著增加。
2、能够存储的数据太少
每一个节点保存的数据量太小了。没有很好的利用操作磁盘IO的数据交换特性,也没有利用好磁盘IO的预读能力(空间局部性原理),从而带来频繁的IO操作。
哈希索引
InnDB存储引擎使用哈希算法来对字典进行查找,适用于等值查询。
聚集索引和非聚集索引
聚集索引
聚集索引是按照每张表的主键构造出一棵B+树,同时叶子节点存放的即为整张表的行记录数据,也将聚集索引的叶子节点称为数据页。聚集索引的这个特性决定了索引组织表中数据也是索引的一部分,同B+树一样,每个数据页都通过一个双向链表来进行连接。
非聚集索引
又称辅助索引,叶子节点并不包含行记录的全部信息。叶子节点除了包含键值外,每个叶子节点中的索引行还包含了一个书签(bookMark),该书签用来告诉InnoDB存储引擎,哪里可以找到与索引相对应的行数据。由于InnoDB存储引擎表是索引组织表,因此InnoDB存储引擎的辅助索引书签就是相应行数据的聚集索引键。每张表上可以有多个辅助索引,当辅助索引来寻找数据时,InnoDB存储引擎会遍历辅助索引并通过叶级别的指针
①获得指向主键索引的主键
②再通过主键索引来找到一个完整的行记录
联合索引
联合索引是指对表上的多个列进行索引。本质上,联合索引也是一棵B+树,不同的是联合索引的键值的数量不是1,而是大于等于2,如下图所示
好处是已经对第二个键值进行了排序处理。从图中可以看到数据是按照(a,b)顺序存储,因此对于selec * from table where a=xxx and b=xxx,可以使用联合索引,对于单个查询 select * from table where a =xxx 也可以使用(a,b)这个联合索引,但对于b列select * from table where b = xxx是无法使用联合索引的。
覆盖索引
InnoDB存储引擎支持覆盖索引,即从辅助索引中就可以得到查询的记录,而不需要查询聚集索引中的记录,使用覆盖索引的一个好处是辅助索引不包含整行记录的所有与信息,故其大小要远小于聚集索引,因此可以减少大量的IO操作。后面索引优化部分详细介绍。
参考资料:《Mysql技术内幕 InnoDB存储引擎》