目的:优化效率差的SQL
语法:EXPLAIN SELECT ……
前言
想优化 SQL 之前,我们得知道 SQL 的执行计划(如是全表扫描还是索引扫描等),Explain 就能查看 SQL 的执行计划。
总结
- EXPLAIN不会告诉你关于触发器、存储过程的信息或用户自定义函数对查询的影响情况
- EXPLAIN不考虑各种Cache
- EXPLAIN不能显示MySQL在执行查询时所作的优化工作
- 部分统计信息是估算的,并非精确值
- EXPALIN只能解释SELECT操作,其他操作要重写为SELECT后,才能查看到其执行计划
概念理解
覆盖索引(Covering Index)
MySQL可以利用索引返回select列表中的字段,而不必根据索引再次读取数据文件。
包含所有满足查询需要的数据的索引称为覆盖索引(Covering Index)。
注意:如果要使用覆盖索引,一定要注意select列表中只取出需要的列,不可select *,因为如果将所有字段一起做索引会导致索引文件过大,查询性能下降。
后过滤(Post-filter)
先读取整行数据,再检查此行是否符合 where 句的条件,符合就留下,不符合便丢弃。因为检查是在读取行后才进行的,所以称为“后过滤”。
解释
id
查询序号,表示查询中执行 select 子句或操作表的顺序。
1、id 相同,可以认为是一组,从上往下顺序执行;
2、在所有组中,id值越大,优先级越高,越先执行;
3、如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行;
select_type
查询类型 select_type,将select查询分为简单(simple)和复杂两种类型。
复杂类型又分为子查询(subquery)和from列表中包含子查询(drived);
1、simple:表示简单select,即查询中不包含子查询或者 union;
2、primary:查询中若包含任何复杂的子部分,最外层查询则被标记为 primary;
3、subQuery:在SELECT或WHERE列表中包含了子查询;
4、derived:衍生。在FROM列表中包含的子查询;
mysql会递归执行并将结果放到一个临时表中。服务器内部称为”派生表”,因为该临时表是从子查询中派生出来的
5、union:若第二个SELECT出现在UNION之后,则被标记为UNION;若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED;
6、union result:从UNION表获取结果的SELECT被标记为:UNION RESULT;
type
MySQL 在表中找到所需行的方式,又称“访问类型”;
其值:null > system > const > eq_ref > ref > range > index > all(从左到右,性能由高到低)
(注:前6种情况都是理想情况的索引使用情况。通常优化至少到range级别,最好能优化到 ref)
1、null:优化过程中就已经得到结果,不再访问表或索引;MySQL在优化过程中分解语句,执行时甚至不用访问表或索引,例如从一个索引列里选取最小值可以通过单独索引查找完成;
2、system:系统查询
3、const:常量查询
在整个查询过程中这个表最多只会有一条匹配的行,比如主键 id=1 就肯定只有一行,只需读取一次表数据便能取得所需的结果,且表数据在分解执行计划时读取。
当结果不是一条时,就会变成index或range等其他类型。
4、eq_ref:使用唯一索引查找(主键或唯一索引)。如多表连接中使用primary key或者 unique key作为关联条件;
5、ref:非唯一索引访问或者唯一索引的前缀访问,返回匹配某个单独值的记录行;
6、range:以范围的形式扫描。如between 或 小于< 或大于>查询等。当mysql使用索引去查找一系列值时,例如IN()和OR列表,也会显示range(范围扫描),当然性能上面是有差异的;
7、index:按索引次序扫描,先读索引,再读实际的行,结果还是全表扫描,主要优点是避免了排序。因为索引是排好的;
8、all:全表扫描;
possible_keys:可能用到的索引
指出 MySQL 使用哪个索引在该表找到行记录,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询使用。
如果该值为 NULL,说明没有使用索引,可以建立索引提高性能。
key:实际用到的索引
显示MySQL在查询中实际使用的索引,若没有使用索引,显示为NULL。
key_len:索引字段最大可能使用长度
表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度(key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的)。
ref
指出对 key 列所选择的索引的查找方式,显示该表的索引字段关联了哪张表的哪个字段。
常见的值有 const, func, NULL, 具体字段名。当 key 列为 NULL ,即不使用索引时,此值也相应的为 NULL 。
rows:估计需要扫描的行数
表示MySQL根据表统计信息及索引选用情况,估算的找到所需的记录所需要读取的行数,数值越小越好。
filtered
返回结果的行数占读取行数的百分比,值越大越好
Extra:显示以上信息之外的其他信息
包含不合适在其他列中显示但十分重要的额外信息。
注意:出现前 2 个值,SQL 语句必须要优化。
1、Using filesort:MySQL中无法利用索引完成的排序操作称为“文件排序”;
2、Using temporary:使用到临时表(基于内存的表),常见于排序和分组查询;
3、Using index:此查询使用了覆盖索引(Covering Index),即通过索引就能返回结果,无需访问表;
若没显示”Using index”表示读取了表数据。
4、Using where:表示mysql服务器从存储引擎收到行后再进行后过滤(Post-filter)。许多where条件里涉及索引中的列,当(并且如果)它读取索引时,就能被存储引擎检验,因此不是所有带where字句的查询都会显示”Using where”。有时”Using where”的出现就是一个暗示:查询可受益与不同的索引;
5、Using join buffer:使用连接缓存。该值强调了在获取连接条件时没有使用索引,并且需要连接缓冲区来存储中间结果。如果出现了这个值,那应该注意,根据查询的具体情况可能需要添加索引来改进性能;
6、distinct:发现第一个匹配后,停止为当前的行组合搜索更多的行;
7、Impossible where:强调了where语句会导致没有符合条件的行;
8、Select tables optimized away:意味着仅通过使用索引,优化器可能仅从聚合函数结果中返回一行;
9、Index merges:当MySQL 决定要在一个给定的表上使用超过一个索引的时候,就会出现以下格式中的一个,详细说明使用的索引以及合并的类型;
Using sort_union(…)
Using union(…)
Using intersect(…)