数据库系列5：explain命令

最新推荐文章于 2024-09-22 13:00:20 发布

纵横千里，捭阖四方

最新推荐文章于 2024-09-22 13:00:20 发布

阅读量2.4k

点赞数 1

分类专栏： JavaEE

本文链接：https://blog.csdn.net/xueyushenzhou/article/details/115533149

版权

JavaEE 专栏收录该内容

85 篇文章 6 订阅

订阅专栏

索引是不是创建越多越好，或者给越多的字段加索引越好呢？根据上一章介绍的索引特征，我们会发现不一定。优化器本身能进行一定的优化，原则就是基于开销cost，而不是基于规则和语义的，怎么开销小就怎么来。但是我们平时用的时候也要注意一些规则，网上总结了一下，常用规则有如下一些，那我们如何检验我们索引的效果呢？其核心就是使用explain来精准分析每条语句的执行情况，所以熟悉explain各个字段的含义和用法是基础，本文就来梳理一下相关内容。
常用的数据库设计基本原则：
1.用于where判断和order排序和jion的，on的，group by 的字段上创建索引
2.索引的个数不要过多，否则浪费空间，更新变慢。
3.过长的字段，建立前缀索引。
4.区分度低的字段，例如性别等，不要建立索引，离散度太低，导致扫描行过多。
5.频繁更新的值，不要作为主键或者索引，这导致页分裂
6.随机无序的值，不要建立索引，例如身份证，UUID等。无序导致页分裂
7.组合索引把离散度高的值放在前面
8.创建复合索引，而不是修改单例索引。
3.2 什么时候用不到索引
1.索引上使用函数，表达式计算
2.字符串不加引号，出现隐式转换
3.like条件前面带%，过滤的开销太大，可以用全文索引
4.负向查询例如not like就不能。！=，<>,和not in 在某些情况下可以。

1 explain是什么

（1） explain的含义
是查看执行计划。使用EXPLAIN关键字可以模拟优化器执行SQL查询语句，从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈
（2）explain能干嘛

表的读取顺序
数据读取操作的操作类型
哪些索引可以使用
哪些索引被实际使用
表之间的应用
每张表有多少行被优化器查询

（3）如何使用
非常简单，在SQL之前加explain就行了，其包含的内容为下面的显示的查询列表的每个列名称：
在这里插入图片描述
如果要熟练使用explain分析性能，我们必须对每个字段的含义非常熟悉，现在我们先看一下各个字段的含义.

2 explain各个字段的含义

2.1 id字段

select查询的序列号，包含一组数字，表示查询中执行select子句或操作表的顺序
该字段会有三种情况：
1.id相同，执行顺序由上至下
2.id不同，如果是子查询，id的序号会递增，id值越大优先级越高，越先被执行
3.id相同不同，同时存在
上面的是什么意思呢？
先看第一种：id相同，执行顺序由上至下
我们现在假定有三张表t1，t2和t3，执行这样一个语句：
在这里插入图片描述
id都为1，根据上述说明是顺序加载，也就是下面的红框里的t1，t3和t2，而我们理解应该是t1，t2，t
3的顺序加载的，两者明显不一样，但是这里告诉我们了计算机如何进行加载的。

第二种：id不同，如果是子查询，id的序号会递增，id值越大优先级越高，越先被执行
在这里插入图片描述
如果是子查询，id序号会递增，id值越大优先级越高，越先被执行，这里的加载顺序就是t3，t1和t2，这就是计算机理解的顺序
这里我们也能看到后面两个的类型是子查询subquery。

第三种 id相同不同，同时存在
看这个例子：
这里的t1是一个衍生出来的表，所以table属性为derived（衍生）,后面的参数2表示从表2衍生出来的。
在这里插入图片描述

2.2 select_type 字段

查询的类型，主要是用于区别普通查询、联合查询、子查询等的复杂查询，一共有6种：

SIMPLE：简单的select查询，查询中不包含子查询或者UNION。
PRIMARY：查询中包含任何复杂的子部分，最外层查询则被标记为PRIMARY。
SUBQUERY：在select或者where中包含了子查询。
DERIVED：在FROM列表中包含的子查询被标记为DERIVED（衍生）。MySQL会递归执行这些子查询，把结果放在临时表里。
UNION：若第二个SELECT出现在UNION之后，则被标记为UNION；若UNION包含在FROM子句的子查询中，外层SELECT将被标记为：DERIVED。
UNION RESULT：从UNION表中获取结果的SELECT
比如这个例子：

2.3 table字段

显示这一行的数据是关于哪些表的。id列会重复，但是整体是递增的，可以根据table字段判断顺序号对应的是哪个表。

2.4 type

特别重要的字段
type代表了查询用了何种类型，一共12种，结果值从最好到最坏依次是：
system>const>eq_ref>ref>fulltext>ref_or_null>index_merge>unique_subquery>index_subquery>range>index>All

查询常用有7种类型，从最好到最差以此为：
system>const>eq_ref>ref>range>index>ALL
这些类型的含义是：
①system：表只有一行记录（等于系统表），这是const类型的特例，平时不会出现，这个也可以忽略不计。
②const：表示通过索引一次就找到了，const用于比较primary key或则unique索引。因为只匹配一行数据，所以很快。如将主键置于where列表中，MySQL就能将该查询转换为一个常量。
③eq_ref：唯一性索引扫描，对于每个索引键，表中只有一条记录与之匹配。常见于主键或唯一索引扫描。
④ref：非唯一性索引扫描，返回匹配某个单独值的所有行。本质上也是一种索引访问，它返回所有匹配某个单独值的行，然而，它可能会找到多个符合条件的行，所以它应该属于查找和扫描的混合体。
⑤ range：只检索给定范围的行，使用一个索引来选择行。key列显示使用了哪个索引。一般就是在你的where语句中出现了between、<、>、in等的查询。这种范围扫描索引扫描比全表扫描要好，因为它只需要开始于索引的某一点，而结束于另一点，不会扫描全部索引。
⑥index：全索引扫描，index与All区别为index类型只遍历索引树。这通常比All快，因为索引文件通常比数据文件小。（也就是说虽然all和index都是读全表，但index是从索引中读取的，而all是从硬盘中读的）
⑦all：全表扫描，将遍历全表以找到匹配的行。
一般来说，得保证查询至少达到range级别，最好能达到ref。
看几个例子：
system和const 其实就是单行单表这样查询速度的确最快。
在这里插入图片描述
eq_ref是这样的：

ref就是正常使用索引查到的，例如下面的代码为t1表的两个字段col1,col2创建了一个索引，然后查询时使用了col1：

range是范围查找，比全表查要好一些：

index是全索引扫描，这里其实就是为id建立了索引，不用进行全表扫描，这其实就是查不到时的场景。
在这里插入图片描述
全表扫描，没有索引，又不存在时，一定是全表扫描了。

2.5 possible_keys和key

possible_keys显示可能应用在这张表中的索引，一个或多个。查询涉及到的字段上若存在索引，则该索引将被列出。但不一定被查询实际使用。
key是实际使用的索引。如果为NULL，则没有使用索引。查询中若使用了覆盖索引，则该索引仅出现在key列表中，不会出现在possible_keys列表中。（覆盖索引：查询的字段与建立的复合索引的个数一一吻合）
在这里插入图片描述
覆盖索引：select 后面接的字段(下面为col1,col2)和创建的复合索引的个数和顺序一模一样，例如：

2.6 key_len

表示索引中使用的字节数，可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下，长度越短越好。key_len显示的值为索引字段的最大可能长度，并非实际使用长度，即key_len是根据表定义计算而得，不是通过表内检索出的。例如
在这里插入图片描述

2.7 ref

显示索引的哪一列被使用了，如果可能的话，是一个常数。哪些列或常量被用于查找索引列上的值。查询中与其它表关联的字段，外键关系建立索引。
在这里插入图片描述

2.8 rows

根据表统计信息及索引选用情况，大致估算出找到所需的记录所需要读取的行数。

2.9 Extra

包含不适合在其他列中显示但十分重要的额外信息。比较重要的有：

Using filesort：说明mysql会对数据使用一个外部的索引排序，而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作成为“文件排序”。
Using temporary：使用了临时表保存中间结果，MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询group by。
Using index：表示相应的select操作中使用了覆盖索引（Covering Index），避免访问了表的数据行，效率不错！如果同时出现using where，表明索引被用来执行索引键值的查找；如果没有同时出现using where，表明索引用来读取数据而非执行查找动作。
Using where：表明使用了where过滤。
Using join buffer：使用了连接缓存。
impossible where：where子句的值总是false，不能用来获取任何元组。（查询语句中where的条件不可能被满足，恒为False）
select tables optimized away：在没有GROUPBY子句的情况下，基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作，不必等到执行阶段再进行计算，查询执行计划生成的阶段即完成优化。
distinct：优化distinct操作，在找到第一匹配的元组后即停止找相同值的动作。

3 看一个热身case

在这里插入图片描述
这个说明了什么呢？根据id越大越早执行的原则:
首先执行的是第四行，id为4，select_type为union里的第二个select，最先执行[select name id from t2]
之后执行的是第二行，id为3，是整个查询中第三个select的一部分，因查询包含在from中，所以是derived[select t1 where other_column=""]
之后执行的是第三行，id为2，select列表中的子查询select_type为subquery，为整个查询中的第二个select[select id from t3]
之后执行第一行，id为1，表示union里的第一个select，select_type列的primary表示该查询为外层查询，table被标记为,表示查询结果来自一个衍生表，其中derived3里的3表示该查询衍生自第三个select查询，[select d1.name …]