概述
索引提高了数据的查询效率,常见的索引模型有哈希表、有序数组、搜索树。
- 哈希表:适用于等值查询场景;
- 有序数组:适用于等值查询和范围查询
- 二叉搜索树:树高太高时,读磁盘次数压力大(索引即存储在内存,也存储在磁盘);
- N叉树:在二叉树的基础上做了优化,减少读磁盘次数。
InnoDB 的索引模型
- InnoDB中表是根据主键顺序以索引的形式存放的;
- 数据存放在B+树(动态展示B+树)中;且每一个索引对应一颗B+树;
- 主键索引的叶子结点存放着所有数据,普通索引的叶子结点存放着主键ID;
- 回表:普通索引查询除ID之外的值时,需要先通过普通索引到普通索引树查找到对应的主键ID,再通过主键ID查询主键ID树获取对应的值。
索引维护
为避免页分裂的出现,通常使用递增的主键ID。
- 页分裂:某数据页已存满,再往这个数据页写数据时,就会新建一个数据页,将部分数据挪过去;
- 页合并:页分裂的逆过程
覆盖索引
无需回表,就可以直接查询到结果。
最左前缀原则
建立联合索引时,会遵循从左到右依次匹配的原则。
索引下推
索引下推(Index Condition Pushdown,简称 ICP)是MySQL5.6做的优化,对使用最左前缀匹配原则下的索引中包含的字段进行优先判断,减少回表次数。如:name、age是联合索引,查询语句如下:
mysql> select * from tuser where name like '张%' and age=10 and ismale=1;
无索引下推执行流程:查到以“张”开头的name后,不会看age的值,直接回表到主键索引进行查询,故需要回表4次;
索引下推执行流程:查到以“张”开头的name后,再判断age的值,再回表到主键索引进行查询,故需要回表2次。
本文为《MySQL实战45讲》学习笔记