使用explain关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的,分析你的查询语句或是表结构的性能瓶颈。
explain执行计划包含的信息
explain select * from person where user_id='123'
其中最重要的字段为:id、type、key、rows、Extra
各字段详解:
目录
2.3、DEPENDENT UNION 与 UNIOIN RESULT
2.4、SUBQUERY 与 DEPENDENT SUBQUERY
2.6、UNCACHEABLE SUBQUERY 与 UNCACHEABLE UNION
10.9、select tables optimized away:
2.3、DEPENDENT UNION 与 UNIOIN RESULT
2.4、SUBQUERY 与 DEPENDENT SUBQUERY
2.6、UNCACHEABLE SUBQUERY 与 UNCACHEABLE UNION
10.9、select tables optimized away:
1、id :select查询的序列号
select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序
三种情况:
- 1、id相同:执行顺序由上至下
- 2、id不同:如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
- 3、id相同又不同(两种情况同时存在):id如果相同,可以认为是一组,从上往下顺序执行;在所有组中,id值越大,优先级越高,越先执行
2、select_type 查询的类型
select_type | 解释 | 测试sql |
---|---|---|
simple | 简单查询 | select * from tb_student |
primary | 需要union 或子查询,指外层查询、主查询 | select (select name from tb_student where id =1) from tb_student |
union | union 中第二个语句或后面的语句 | select * from tb_student union select * from tb_student |
dependent union | 查询与外部相关(mysql优化器会将in优化成exists) | select * from tb_student where id in(select id from tb_student union select id from tb_student) select * from tb_student a where EXISTS (select 1 from tb_student where id = a.id union select id from tb_student where id = a.id) |
union result | union结果集 | select * from tb_student union select * from tb_student |
subquery | 除了from包含的子查询,子查询中的第一个select | select (select name from tb_student where id =1) from tb_student |
depend subquery | 类似depend union,子查询中的第一个select,独立于外部查询 | select (select name from test.tb_student a where a.id=b.id) from test.tb_student b |
derived | 派生表,子查询在from的子句中 | select * from (select * from tb_student) t |
materialized | 物化子查询 | |
uncacheable subquery | 结果集不能被缓存的子查询 | |
uncacheable union | union 中第二个语句或后面的语句榆树不可缓存的子查询 |
2.1、simple
简单的SELECT语句(不包括UNION操作或子查询操作)
2.2、PRIMARY/UNION
PRIMARY:查询中最外层的SELECT(如两表做UNION或者存在子查询,则 外层的表操作为PRIMARY,内层的操作为UNION)
UNION:UNION操作中,查询中处于内层的SELECT(内层的SELECT语句与外层的SELECT语句没有依赖关系)
2.3、DEPENDENT UNION 与 UNIOIN RESULT
DEPENDENT UNION:UNION操作中,查询中处于内层的SELECT(内层的SELECT语句与外层的SELECT语句有依赖关系)。
UNION RESULT:UNION操作的结果,id值通常为NULL。
例子 :select * from people where zipcode=10000 union select * from people where zipcode=1000;
2.4、SUBQUERY 与 DEPENDENT SUBQUERY
SUBQUERY:子查询中首个SELECT(如果有多个子查询存在):
DEPENDENT SUBQUERY:子查询中首个SELECT,但依赖于外层的表(如果有多个子查询存在)
重点解释:
子查询的查询方式依赖于外面的查询结果。下面这个例子就是:先进行子查询外部的查询,得到一个结果集,.然后这个结果的每一行在跟select子查询的结果集进行匹配,也就是说,外部结果集的每一行都要关联内部结果集一次。
2.5、DERIVED 与 MATERIALIZED
DERIVED:被驱动的SELECT子查询(子查询位于FROM子句)
例子 :select aa from (select * from a) b;
MATERIALIZED:被物化的子查询
2.6、UNCACHEABLE SUBQUERY 与 UNCACHEABLE UNION
UNCACHEABLE SUBQUERY:对于外层的主表,子查询不可被物化,每次都需要计算(耗时操作);
UNCACHEABLE UNION:UNION操作中,内层的不可被物化的子查询(类似于UNCACHEABLE SUBQUERY)。
3、table
table列表示 正在访问哪个表。
当 from 子句中有子查询时,table列是 <derivenN> 格式,表示当前查询依赖 id=N 的查询,于是先执行 id=N 的查询。
当有 union 时,UNION RESULT 的 table 列的值为 <union1,2>,1和2表示参与 union 的 select行id。
mysql>explain select * from (select * from ( select * from t3 where id=3952602) a) b;
+----+-------------+------------+--------+-------------------+---------+---------+------+------+-------+
| id | select_type | table | type |possible_keys | key | key_len |ref | rows | Extra |
+----+-------------+------------+--------+-------------------+---------+---------+------+------+-------+
| 1 | PRIMARY | <derived2> | system |NULL |NULL | NULL | NULL | 1 | |
| 2 | DERIVED | <derived3> | system |NULL |NULL | NULL | NULL | 1 | |
| 3 | DERIVED | t3 | const | PRIMARY,idx_t3_id | PRIMARY | 4 | | 1 | |
+----+-------------+------------+--------+-------------------+---------+---------+------+------+-------+
4、type
访问类型,sql查询优化中一个很重要的指标,结果值从好到坏依次是:
system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > all
一般来说,好的sql查询至少达到range级别,最好能达到ref。
除了all之外,其他的type都可以使用到索引;除了index_merge之外,其他的type只可以用到一个索引。
4.1、system
表中只有一行数据或者是空表,且只能用于myisam和memory 引擎表。如果是Innodb引擎表,type列在这个情况通常都是all或者index。
4.2、const
表示通过索引一次就找到了,const用于比较primary key 或者 unique索引。因为只需匹配一行数据,所有很快。如果将主键置于where列表中,mysql就能将该查询转换为一个const。
总结:const,system:mysql能对查询的某部分进行优化并将其转化成一个常量(可以看show warnings 的结果)。用于 primary key 或 unique key 的所有列与常数比较时,所以表最多有一个匹配行,读取1次,速度比较快。
4.3、eq_ref
唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或 唯一索引扫描。=》primarykey 或 unique key 索引的所有部分被连接使用,最多只会返回一条符合条件的记录。这可能是在 const 之外最好的联接类型了,简单的 select 查询不会出现这种 type。
注意:ALL全表扫描的表记录最少的表如t1表。
4.4、ref
非唯一性索引扫描,返回匹配某个单独值的所有行。本质是也是一种索引访问,它返回所有匹配某个单独值的行,然而他可能会找到多个符合条件的行,所以它应该属于查找和扫描的混合体 。
4.5、fulltext
全文索引检索,要注意,全文索引的优先级很高,若全文索引和普通索引同时存在时,mysql不管代价,优先选择使用全文索引。
4.6、ref_or_null
与ref方法类似,只是增加了null值的比较。实际用的不多。
explain select * from t1 where name = "t1_name1" or name is null;
+----+-------------+-------+-------------+---------------+----------+---------+-------+------+--------------------------+
| id | select_type | table | type |possible_keys | key | key_len| ref | rows | Extra |
+----+-------------+-------+-------------+---------------+----------+---------+-------+------+--------------------------+
| 1 | SIMPLE | t1 | ref_or_null |idx_name |idx_name | 33 | const | 2 | Using where; Using index |
+----+-------------+-------+-------------+---------------+----------+---------+-------+------+--------------------------+
4.7、index_merge:
表示查询使用了两个以上的索引,最后取交集或者并集,常见and ,or的条件使用了不同的索引,官方排序这个在ref_or_null之后,但是实际上由于要读取所有索引,性能可能都不如range。
表示使用了索引合并的优化方法。 例如下表:id是主键,tenant_id是普通索引。or 的时候没有用 primary key,而是使用了 primary key(id) 和 tenant_id 索引
mysql> explain select * from role where id = 11011 or tenant_id = 8888;
+----+-------------+-------+-------------+-----------------------+-----------------------+---------+------+------+-------------------------------------------------+
| id | select_type | table | type |possible_keys | key |key_len | ref | rows |Extra |
+----+-------------+-------+-------------+-----------------------+-----------------------+---------+------+------+-------------------------------------------------+
| 1 | SIMPLE | role | index_merge | PRIMARY,idx_tenant_id |PRIMARY,idx_tenant_id |4,4 | NULL | 134 | Using union(PRIMARY,idx_tenant_id); Using where |
+----+-------------+-------+-------------+-----------------------+-----------------------+---------+------+------+-------------------------------------------------+
4.8、unique_subquery
用于where中的in形式子查询,子查询返回不重复值唯一值。
4.9、index_subquery
用于in形式子查询使用到了辅助索引或者in常数列表,子查询可能返回重复值,可以使用索引将子查询去重。
4.10、range
只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引。一般就是在where语句中出现了bettween、<、>、in等的查询。这种索引列上的范围扫描比全索引扫描要好。只需要开始于某个点,结束于另一个点,不用扫描全部索引
4.11、index
Full Index Scan 全表扫描,index与ALL区别为index类型只遍历索引树。这通常为ALL块,应为索引文件通常比数据文件小。(Index与ALL虽然都是读全表,但index是从索引中读取,而ALL是从硬盘读取) 。
4.12、ALL
Full Table Scan 全表扫描,遍历全表以找到匹配的行。
5、possible_keys
这一列显示查询可能使用哪些索引来查找。
explain时可能出现 possible_keys 有值,而 key 显示 NULL 的情况,这种情况是因为表中数据不多,mysql认为索引对此查询帮助不大,选择了全表查询。
如果该列是NULL,则没有相关的索引。在这种情况下,可以通过检查 where 子句看是否可以创造一个适当的索引来提高查询性能,然后用 explain 查看效果。
6、key
实际使用的索引,如果为NULL,则没有使用索引。
查询中如果使用了覆盖索引,则该索引仅出现在key列表中
7、key_len
表示索引中使用的字节数,查询中使用的索引的长度(最大可能长度),并非实际使用长度,理论上长度越短越好。key_len是根据表定义计算而得的,不是通过表内检索出的。
这一列显示了mysql在索引里使用的字节数,通过这个值可以算出具体使用了索引中的哪些列。
key_len计算规则如下:
- 字符串
- char(n):n字节长度
- varchar(n):2字节存储字符串长度,如果是utf-8,则长度 3n + 2
- 数值类型
- tinyint:1字节
- smallint:2字节
- int:4字节
- bigint:8字节
- 时间类型
- date:3字节
- timestamp:4字节
- datetime:8字节
如果字段允许为 NULL,需要1字节记录是否为 NULL
索引最大长度是768字节,当字符串过长时,mysql会做一个类似左前缀索引的处理,将前半部分的字符提取出来做索引。
8、ref
显示索引的哪一列被使用了,如果可能,是一个常量const。
这一列显示了在key列记录的索引中,表查找值所用到的列或常量,常见的有:const(常量),func,NULL,字段名(例:film.id)
9. rows
根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数。
10、Extra
不适合在其他字段中显示,但是十分重要的额外信息。
10.1、Using filesort :
mysql对数据使用一个外部的索引排序,而不是按照表内的索引进行排序读取。也就是说mysql无法利用索引完成的排序操作成为“文件排序”
MySQL有两种方式可以生成有序的结果,通过排序操作或者使用索引,当Extra中出现了Using filesort 说明MySQL使用了后者,但注意虽然叫filesort但并不是说明就是用了文件来进行排序,只要可能排序都是在内存里完成的。大部分情况下利用索引排序更快,所以一般这时也要考虑优化查询了。使用文件完成排序操作,这是可能是ordery by,group by语句的结果,这可能是一个CPU密集型的过程,可以通过选择合适的索引来改进性能,用索引来为查询结果排序。
由于索引是先按email排序、再按address排序,所以查询时如果直接按address排序,索引就不能满足要求了,mysql内部必须再实现一次“文件排序”
10.2、Using temporary:
使用临时表保存中间结果,也就是说mysql在对查询结果排序时使用了临时表,常见于order by 和 group by
10.3、Not exists
MYSQL优化了LEFT JOIN,一旦它找到了匹配LEFT JOIN标准的行, 就不再搜索了。
10.4、Using index:
说明查询是覆盖了索引的,不需要读取数据文件,从索引树(索引文件)中即可获得信息。如果同时出现using where,表明索引被用来执行索引键值的查找,没有using where,表明索引用来读取数据而非执行查找动作。这是MySQL服务层完成的,但无需再回表查询记录。
表示相应的select操作中使用了覆盖索引(Covering Index),不需要读取数据文件,从索引树(索引文件)中即可获得信息,避免了访问表的数据行,效率高 。
如果同时出现Using where,表明索引被用来执行索引键值的查找(参考上图)
如果没用同时出现Using where,表明索引用来读取数据而非执行查找动作 。
覆盖索引(Covering Index):也叫索引覆盖。就是select列表中的字段,只用从索引中就能获取,不必根据索引再次读取数据文件,换句话说查询列要被所建的索引覆盖。
注意:
a、如需使用覆盖索引,select列表中的字段只取出需要的列,不要使用select *
b、如果将所有字段都建索引会导致索引文件过大,反而降低crud性能。
10.5、Using index condition
这是MySQL 5.6出来的特性,叫做“索引条件推送”。简单说一点就是MySQL原来在索引上是不能执行如like这样的操作的,但是现在可以了,这样减少了不必要的IO操作,但是只能用在二级索引上。
10.6、Using where
使用了WHERE从句来限制哪些行将与下一张表匹配或者是返回给用户。注意:Extra列出现Using where表示MySQL服务器将存储引擎返回服务层以后再应用WHERE条件过滤。
10.7、Using join buffer
使用了连接缓存:Block Nested Loop,连接算法是块嵌套循环连接;Batched Key Access,连接算法是批量索引连接
10.8、Impossible WHERE:
where子句的值总是false,不能用来获取任何元祖
10.9、select tables optimized away:
在没有group by子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段在进行计算,查询执行计划生成的阶段即可完成优化。
10.10、distinct:
优化distinct操作,在找到第一个匹配的元祖后即停止找同样值得动作。
11、综合情况
执行顺序
- (id = 4)、【select id, name from t2】:select_type 为union,说明id=4的select是union里面的第二个select。
- (id = 3)、【select id, name from t1 where address = ‘11’】:因为是在from语句中包含的子查询所以被标记为DERIVED(衍生),where address = ‘11’ 通过复合索引idx_name_email_address就能检索到,所以type为index。
- (id = 2)、【select id from t3】:因为是在select中包含的子查询所以被标记为SUBQUERY。
- (id = 1)、【select d1.name, … d2 from … d1】:select_type为PRIMARY表示该查询为最外层查询,table列被标记为 “derived3”表示查询结果来自于一个衍生表(id = 3 的select结果)。
- (id = NULL)、【 … union … 】:代表从union的临时表中读取行的阶段,table列的 “union 1, 4”表示用id=1 和 id=4 的select结果进行union操作。