本文内容基于MySQL5.7
什么是Explain
Explain是一个关键字,可以查询select语句的执行情况, 比如SQL可能使用什么索引,实际使用了什么索引。它的用法非常简单,在查询语句前加上explain关键字,执行后会得到类似下方的结果,里面的每一列会在下方详细介绍。本文主要解释这些字段的含义,需要注意的是针对的是查询语句,下文不在强调。
列含义说明
先枚举出字段及描述,在有个大致了解的情况下,再结合案例详细描述。
字段 | 描述 |
---|---|
id | 复杂sql会包含多个查询(多个seclet),id代表执行的有序(可理解为优先级) |
select_type | 查询的类型,代表查询的简易程度。 |
table | 查询的表 |
type | 表的连接类型 |
possible_keys | 可能使用的索引 |
key | 实际使用的索引 |
key_len | 索引的长度 |
ref | 这一列显示了在key列记录的索引中,表查找值所用到的列或常量 |
rows | innodb预计读的行数,不是实际行数 |
extra | 扩展信息 |
type
type 的值 | 解释 |
---|---|
system | 查询的表中只有一行数据,查的是常量,这是最好的结果 |
const | 基于主键或唯一索引查询,最多返回一条结果 |
eq_ref | 表连接时基于主键或非 NULL 的唯一索引完成扫描 |
ref | 基于普通索引的等值查询,或者表间等值连接 |
range | 利用索引进行范围查询 |
index | 全索引扫描 |
ALL | 全表扫描 |
type字段代表SQL的表连接类型。连接类型的优先级是: system > const > eq_ref > ref > range > index > ALL 。一般优化到range与ref级别即可,system,const情况在公司中基本不可能出现。
id
id代表select的执行优先级,数字越大优先级越高。有两种特殊情况:存在两个一样的id,顺序执行
id为null,最后一个执行。
select_type
根据字面意思理解最好记,就是查询类型。在MySQL中一共有一下几种查询类型:
查询类型 | 描述 |
---|---|
primary | 可以理解为最外层的查询(通常是优先级最低的SQL) |
derived | from型子查询:生成一张临时表供查询使用(from之后的查询) |
subquery | select型子查询:(from之前的查询) |
simple | 简单查询:不包含子查询及复杂查询 |
table
table指查询的表名
possible_key
possible_key代表可能使用的索引。大多数情况下这个索引就是最终使用的索引,当然也存在有possible_key有值但是查询没用这个索引的情况,原因可能是,表中数据量少,MySQL认为扫全表会更快。
如果你查询出来这个字段为null,即代表没有建立索引,可以适当增加
key
key通常与possible_key是一起看的,它代表查询实际用的索引,这个值是可以为null的,也就是没有走索引。我们可以用force index、ignore index来强制使用或者不使用possible_key列的索引。
key_len
key_len代表索引的长度,单位是字节,比如一个int类型当索引,那么key_len的长度就是4。如果使用了联合索引(int,int),这个时候如果只用了第一个int,可能长度就是5,这个5是4+1,1代表null
key_len计算规则如下:
- 字符串,char(n)和varchar(n),5.0.3以后版本中,n均代表字符数,而不是字节数,如果是utf-8,一个数字 或字母占1个字节,一个汉字占3个字节
- char(n):如果存汉字长度就是 3n 字节
- varchar(n):如果存汉字则长度是 3n + 2 字节,加的2字节用来存储字符串长度,因为 varchar是变长字符串
- 数值类型
- tinyint:1字节
- smallint:2字节
- int:4字节
- bigint:8字节
- 时间类型 date:3字节 timestamp:4字节 datetime:8字节
- 如果字段允许为 NULL,需要1字节记录是否为 NULL
索引最大长度是768字节,当字符串过长时,mysql会做一个类似左前缀索引的处理,将前半部分的字符提取出来做索 引。
ref
这一列显示了在key列记录的索引中,表查找值所用到的列或常量,常见的有:const(常量),字段名(例:film.id)
rows
MySQL预计要读的行数,不是实际查询结果的行数
extra
1 Using index 使用覆盖索引
覆盖索引定义:mysql执行计划explain结果里的key有使用索引,如果select后面查询的字段都可以从这个索引的树中 获取,这种情况一般可以说是用到了覆盖索引,extra里一般都有using index;覆盖索引一般针对的是辅助索引,整个 查询结果只通过辅助索引就能拿到结果,不需要通过辅助索引树找到主键,再通过主键去主键索引树里获取其它字段值
2 Using where:使用 where 语句来处理结果,并且查询的列未被索引覆盖
3 Using index condition:查询的列不完全被索引覆盖,where条件中是一个前导列的范围;
4 Using temporary:mysql需要创建一张临时表来处理查询。出现这种情况一般是要进行优化的,首先是想到用索 引来优化。
5 Using filesort:将用外部排序而不是索引排序,数据较小时从内存排序,否则需要在磁盘完成排序。这种情况下一 般也是要考虑使用索引来优化的。
常用索引技巧
- 联合索引最好全值匹配:联合索引用到的字段越多,效率越高。可以通过索引长度印证使用的索引字段
- 最左前缀原则:联合索引下,需满足最左原理且必须连续,不可中断。顺序可以打乱,MySQL会帮我们优化,但是最好自己写好 ,不要把什么都留给MySQL做
- 不在索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描
- 尽量使用覆盖索引(只访问索引的查询(索引列包含查询列)),减少select * 语句
- mysql在使用不等于,not in ,not exists的时候无法使用索引会导致全表扫描。小于,大于,小于等于,大于等于这些,mysql内部优化器会根据检索比例,表大小等多个因素整体评估是否使用索引
- is null ,is not null 一般情况下也无法使用索引
- like以通配符开头(‘%abc…’),mysql索引失效会变成全表扫描
- 少用or或in,用它查询时,mysql不一定使用索引,mysql内部优化器会根据检索比例,表大小等多个因素整体评估是否使用索引,详见范围查询优化