Mysql索引（面试）

最新推荐文章于 2024-05-04 09:38:05 发布

wang_nian

最新推荐文章于 2024-05-04 09:38:05 发布

阅读量91

点赞数

分类专栏： mysql 文章标签：数据库 mysql 索引 java

本文链接：https://blog.csdn.net/wang_nian/article/details/109102001

版权

mysql 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1 索引概念、索引模型

我们是怎么聊到索引的呢，是因为我提到我们的业务量比较大，每天大概有几百万的新数据生成，于是有了以下对话：

Q：那你能说说什么是索引吗？

A：索引其实是一种数据结构，能够帮助我们快速的检索数据库中的数据

Q：那么索引具体采用的哪种数据结构呢？

A：常见的MySQL主要有两种结构：Hash索引和B+ Tree索引，我们使用的是InnoDB引擎，默认的是B+树

Q：既然你提到InnoDB使用的B+ 树的索引模型，那么你知道为什么采用B+ 树吗？这和Hash索引比较起来有什么优缺点吗？

B+Tree相对于B-Tree有几点不同：

非叶子节点只存储键值信息，B-Tree的非叶子节点还存储了data信息，如果data较大，会占用很大空间。
所有叶子节点之间都有一个链指针。
数据记录都存放在叶子节点中。

如图：B-Tree

2 聚簇索引、覆盖索引

MyISAM中有两种索引，分别是主索引和辅助索引，在这里面的主索引使用具有唯一性的键值进行创建，而辅助索引中键值可以相同的。MyISAM分别会存在一个索引文件和数据文件，它的主索引是非聚集索引。当我们查询的时候，我们找到叶子节点中保的地址，然后通过地址我们找到对应的信息。
InnoDB索引和MyISAM的最大区别是它只有一个数据文件。在InnoDB存储引擎中，表数据文件本身就是按B+树组织的一个索引构，这棵树的叶节点数据保存了完整的数据记录，所以我们把它的主索引叫做聚集索引。而它的辅助索引和MyISAM也会有所不同，它的辅助索引都是将主键作为数据域，所以这样当我们查找的时候通过辅助索引先找到主键，然后通过主索引找到对应的主键，从而得到相应的数据信息。
在MyISAM中，主索引和辅助索引（Secondary key）在结构上没有任何区别，只是主索引要求key是唯一的，而辅助索引的key可以重复。InnoDB的辅助索引data域存储相应记录主键的值而不是地址。换句话说，InnoDB的所有辅助索引都引用主键作为data域

Q：那么，聚簇索引和非聚簇索引，在查询数据的时候有区别吗？

A：聚簇索引查询会更快？

Q：为什么呢？

A：因为主键索引树的叶子节点直接就是我们要查询的整行数据了。而非主键索引的叶子节点是主键的值，查到主键的值以后，还需要再通过主键的值再进行一次查询

Q：刚刚你提到主键索引查询只会查一次，而非主键索引需要回表查询多次。（后来我才知道，原来这个过程叫做回表）是所有情况都是这样的吗？非主键索引一定会查询多次吗？

A：（额、这个问题我回答的不好，后来我自己查资料才知道，通过覆盖索引也可以只查询一次）

可以发现区别在与叶子节点中，主键索引存储了整行数据，而非主键索引中存储的值为主键id, 在我们执行如下sql后

SELECT age FROM student WHERE name = '小李'；
复制代码

流程为：

在name索引树上找到名称为小李的节点 id为03
从id索引树上找到id为03的节点获取所有数据
从数据中获取字段命为age的值返回 12

在流程中从非主键索引树搜索回到主键索引树搜索的过程称为：回表，在本次查询中因为查询结果只存在主键索引树中，我们必须回表才能查询到结果，那么如何优化这个过程呢？

什么是覆盖索引？

覆盖索引（covering index ，或称为索引覆盖）即从非主键索引中就能查到的记录，而不需要查询主键索引中的记录，避免了回表的产生减少了树的搜索次数，显著提升性能。

如何使用是覆盖索引？

之前我们已经建立了表student，那么现在出现的业务需求中要求根据名称获取学生的年龄，并且该搜索场景非常频繁，那么先在我们删除掉之前以字段name建立的普通索引，以name和age两个字段建立联合索引，sql命令与建立后的索引树结构如下

ALTER TABLE student DROP INDEX I_name;
ALTER TABLE student ADD INDEX I_name_age(name, age);
复制代码

那在我们再次执行如下sql后

SELECT age FROM student WHERE name = '小李'；
复制代码

流程为：

在name,age联合索引树上找到名称为小李的节点
此时节点索引里包含信息age 直接返回 12

3 联合索引、最左前缀匹配

Q：不知道的话没关系，想问一下，你们在创建索引的时候都会考虑哪些因素呢？

A：我们一般对于查询概率比较高，经常作为where条件的字段设置索引

Q：那你们在创建联合索引的时候，需要做联合索引多个字段之间顺序你们是如何选择的呢？

A：我们把识别度最高的字段放到最前面

Q： 那你知道最左前缀匹配吗？

A：您刚刚问的是这个意思啊，在创建多列索引时，我们根据业务需求，where子句中使用最频繁的一列放在最左边，因为MySQL索引查询会遵循最左前缀匹配的原则，即最左优先，在检索数据时从联合索引的最左边开始匹配。所以当我们创建一个联合索引的时候，如(key1,key2,key3)，相当于创建了（key1）、(key1,key2)和(key1,key2,key3)三个索引，这就是最左匹配原则

4 索引下推、查询优化

Q：你们线上用的MySQL是哪个版本啊呢？

A：我们MySQL是5.7

Q：那你知道在MySQL 5.6中，对索引做了哪些优化吗？

A：不好意思，这个我没有去了解过。（事后我查了一下，有一个比较重要的：Index Condition Pushdown Optimization）

Q：那排查的时候，有什么手段可以知道有没有走索引查询呢？

A：可以通过explain查看sql语句的执行计划，通过执行计划来分析索引使用情况

Q：那什么情况下会发生明明创建了索引，但是执行的时候并没有通过索引呢？

A：（大概记得和优化器有关，但是这个问题并没有回答好）

wang_nian

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Mysql索引（面试）

1索引概念、索引模型我们是怎么聊到索引的呢，是因为我提到我们的业务量比较大，每天大概有几百万的新数据生成，于是有了以下对话：Q：每天几百万数据，一个月就是几千万了，那你们有没有对于查询做一些优化呢？A：我们在数据库中创建了一些索引（我现在非常后悔我当时说了这句话）Q：那你能说说什么是索引吗？A：索引其实是一种数据结构，能够帮助我们快速的检索数据库中的数据Q：那么索引具体采用的哪种数据结构呢？A：常见的MySQL主要有两种结构：Hash索引和B+ Tree索引，我们使用的是Inn.
复制链接

扫一扫