mysql 执行计划详解_MySQL 执行计划详解

我们经常使用 MySQL 的执行计划来查看 SQL 语句的执行效率,接下来分析执行计划的各个显示内容。

执行计划的 id

select 查询的序列号,标识执行的顺序

id 相同,执行顺序由上至下

id 不同,如果是子查询,id 的序号会递增,id 值越大优先级越高,越先被执行

先看id 相同,执行顺序由上至下(本质是先查找表数据量小的表)

普通的关联查询,先查询执行数据量小的表(执行计划的ID相同):

502c16cbf92983768baa9a26e1d5fa1e.png

ff6c7f11e06b3e49b45c812fc3ee5e36.png

id 不同,如果是子查询,id 的序号会递增,id 值越大优先级越高,越先被执行

子查询语句,先执行最内层语句,一层层向外执行查询,看下面的执行计划(执行计划的ID不同)

先查询c表,再执行t表,最后执行tc表

a8a1abeaf407708aa88aac59507f4fbd.png

执行计划的 select_type

48780f9370819808e21089fca6e7cda2.png

查询的类型,主要是用于区分普通查询、联合查询、子查询等。

SIMPLE:简单的 select 查询,查询中不包含子查询或者 union

PRIMARY:查询中包含子部分,最外层查询则被标记为 primary

DERIVED:衍生查询(用到了临时表)

SUBQUERY/MATERIALIZED:SUBQUERY 表示在 select 或 where 列表中包含了子查询,MATERIALIZED:表示 where 后面 in 条件的子查询

UNION:表示 union 中的第二个或后面的 select 语句

UNION RESULT:union 的结果

对于 UNION 和 UNION RESULT 可以通过下面的例子展现:

EXPLAIN

SELECT * FROM users WHERE id IN(1, 2)

UNION

SELECT * FROM users WHERE id IN(3, 4);

319afba746044883335a97c0972b869d.png

只有一个子查询的衍生select_type查询类型

b26de1ce89e3b820d20edee3522ee8ed.png

85b5520b8378b9044b4ab4471475a0ce.png

子查询中用了union的衍生查询

97c447d21d50371124b953242e7ec94c.png

0dd9300fce81e437198a6f7ba544bdf8.png

执行计划的 table

查询涉及到的表。

直接显示表名或者表的别名

由 ID 为 M,N 查询 union 产生的结果

由 ID 为 N 查询产生的结果

执行计划的 type (索引类型)

访问类型,SQL 查询优化中一个很重要的指标,结果值从好到坏依次是(性能由高到低):system > const > eq_ref > ref > range > index > ALL

system:系统表,少量数据,往往不需要进行磁盘IO(理想情况,很少达到)

const:常量连接,只能查到1数据,用于主键或者唯一索引(理想情况,很少达到)

eq_ref:主键索引(primary key)或者非空唯一索引(unique not null)等值扫描(理想情况,很少达到)

ref:非主键非唯一索引等值扫描(优化后一般达到这个级别,前提是有索引)

range:范围扫描(优化后一般达到这个级别,前提是有索引)

index:索引树扫描(全索引扫描)[速度比all快]

ALL:全表数据扫描(full table scan)[不是索引就会全表数据扫描]

addeb058c967efc764b5b799f9a53240.png

下面通过举例说明。

system

explain select * from mysql.time_zone;

c4d6491d48891ac9591e2809a285b2cf.png

上例中,从系统库 MySQL 的系统表 time_zone 里查询数据,访问类型为 system,这些数据已经加载到内存里,不需要进行磁盘 IO,这类扫描是速度最快的。

explain select * from (select * from user where id=1) tmp;

ed4ffa12ec8d3b9cee970e95b7f6801d.png

再举一个例子,内层嵌套(const)返回了一个临时表,外层嵌套从临时表查询,其扫描类型也是 system,也不需要走磁盘 IO,速度超快。

const

数据准备:

48304ba5e6f9fe08f3fa1abda7d326ab.png

CREATE TABLE `user` (

`id` int(11) NOT NULL,

`NAME` varchar(20) DEFAULT NULL,

PRIMARY KEY (`id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

insert into user values(1,'shenjian');

insert into user values(2,'zhangsan');

insert into user values(3,'lisi');

48304ba5e6f9fe08f3fa1abda7d326ab.png

explain select * from user where id=1;

55d510751724d953c40a4a7e77263844.png

const 扫描的条件为:

命中主键(primary key)或者唯一(unique)索引

被连接的部分是一个常量(const)值

如上例,id 是 主键索引,连接部分是常量1。

eq_ref

数据准备:

48304ba5e6f9fe08f3fa1abda7d326ab.png

CREATE TABLE `user` (

`id` int(11) NOT NULL,

`NAME` varchar(20) DEFAULT NULL,

PRIMARY KEY (`id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

insert into user values(1,'shenjian');

insert into user values(2,'zhangsan');

insert into user values(3,'lisi');

CREATE TABLE `user_ex` (

`id` int(11) NOT NULL,

`age` int(11) DEFAULT NULL,

PRIMARY KEY (`id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

insert into user_ex values(1,18);

insert into user_ex values(2,20);

insert into user_ex values(3,30);

insert into user_ex values(4,40);

insert into user_ex values(5,50);

48304ba5e6f9fe08f3fa1abda7d326ab.png

EXPLAIN SELECT * FROM USER,user_ex WHERE user.id=user_ex.id;

548e2a4dec7eb4702b5982b08aefb6a3.png

eq_ref 扫描的条件为,对于前表的每一行(row),后表只有一行被扫描。

再细化一点:

join 查询

命中主键(primary key)或者非空唯一(unique not null)索引

等值连接;

如上例,id 是主键,该 join 查询为 eq_ref 扫描。

ref

数据准备:

48304ba5e6f9fe08f3fa1abda7d326ab.png

CREATE TABLE `user` (

`id` int(11) DEFAULT NULL,

`name` varchar(20) DEFAULT NULL,

KEY `id` (`id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

insert into user values(1,'shenjian');

insert into user values(2,'zhangsan');

insert into user values(3,'lisi');

CREATE TABLE `user_ex` (

`id` int(11) DEFAULT NULL,

`age` int(11) DEFAULT NULL,

KEY `id` (`id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

insert into user_ex values(1,18);

insert into user_ex values(2,20);

insert into user_ex values(3,30);

insert into user_ex values(4,40);

insert into user_ex values(5,50);

48304ba5e6f9fe08f3fa1abda7d326ab.png

EXPLAIN SELECT * FROM USER,user_ex WHERE user.id=user_ex.id;

faaf8ca23f380ebf9fbe21d1367f98c9.png

如果把上例 eq_ref 案例中的主键索引,改为普通非唯一(non unique)索引。就由 eq_ref 降级为了 ref,此时对于前表的每一行(row),后表可能有多于一行的数据被扫描。

select * from user where id=1;

b21f329a917b16d78d6826cea2646ecc.png

当 id 改为普通非唯一索引后,常量的连接查询,也由 const 降级为了 ref,因为也可能有多于一行的数据被扫描。

ref 扫描,可能出现在 join 里,也可能出现在单表普通索引里,每一次匹配可能有多行数据返回,虽然它比 eq_ref 要慢,但它仍然是一个很快的 join 类型。

range

数据准备:

48304ba5e6f9fe08f3fa1abda7d326ab.png

CREATE TABLE `user` (

`id` int(11) NOT NULL,

`name` varchar(20) DEFAULT NULL,

PRIMARY KEY (`id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

insert into user values(1,'shenjian');

insert into user values(2,'zhangsan');

insert into user values(3,'lisi');

insert into user values(4,'wangwu');

insert into user values(5,'zhaoliu');

48304ba5e6f9fe08f3fa1abda7d326ab.png

explain select * from user where id between 1 and 4;

explain select * from user where id in(1,2,3);

explain select * from user where id > 3;

4e428b9c1e126ed630bf40126efc4f0c.png

range 扫描就比较好理解了,它是索引上的范围查询,它会在索引上扫码特定范围内的值。

像上例中的 between,in,>,= 都是典型的范围(range)查询(in有时候会失效,也就是ALL,查询所有【此时不会通过索引查询】)

index

explain count (*) from user;

1b52376f9facc44d847cf7028bc53948.png

如上例,id 是主键,该 count 查询需要通过扫描索引上的全部数据来计数,它仅比全表扫描快一点。

ALL

数据准备:

48304ba5e6f9fe08f3fa1abda7d326ab.png

CREATE TABLE `user` (

`id` int(11) DEFAULT NULL,

`name` varchar(20) DEFAULT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

insert into user values(1,'shenjian');

insert into user values(2,'zhangsan');

insert into user values(3,'lisi');

CREATE TABLE `user_ex` (

`id` int(11) DEFAULT NULL,

`age` int(11) DEFAULT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

insert into user_ex values(1,18);

insert into user_ex values(2,20);

insert into user_ex values(3,30);

insert into user_ex values(4,40);

insert into user_ex values(5,50);

48304ba5e6f9fe08f3fa1abda7d326ab.png

explain select * from user,user_ex where user.id=user_ex.id;

76ec32c9c985c251b45bf8869c04575d.png

如果 id 上不建索引,对于前表的每一行(row),后表都要被全表扫描。

文章中,这个相同的 join 语句出现了三次:

扫描类型为 eq_ref,此时 id 为主键

扫描类型为 ref,此时 id 为非唯一普通索引

扫描类型为 ALL,全表扫描,此时id上无索引

有此可见,建立正确的索引,对数据库性能的提升是多么重要。

总结

explain 结果中的 type 字段,表示(广义)连接类型,它描述了找到所需数据使用的扫描方式;

常见的扫描类型有:system>const>eq_ref>ref>range>index>ALL,其扫描速度由快到慢;

各类扫描类型的要点是:system 最快:不进行磁盘 IO

const:PK 或者 unique 上的等值查询

eq_ref:PK 或者 unique 上的 join 查询,等值匹配,对于前表的每一行,后表只有一行命中

ref:非唯一索引,等值匹配,可能有多行命中

range:索引上的范围扫描,例如:between、in、>

index:索引上的全集扫描,例如:InnoDB 的 count

ALL 最慢:全表扫描建立正确的索引,非常重要;

使用 explain 了解并优化执行计划,非常重要;

执行计划 possible_keys

查询过程中有可能用到的索引,是一种预测,不准。

02b22cf9f9b75f756cf104fdf304a20a.png

执行计划 key

实际使用的索引,如果为 NULL ,则没有使用索引。

0814b3282e321bd0c535ff153360de27.png

key_lens

相关视频资源见(课程:51CTO 《SQL优化(MySQL版)》10索引类型及逐步优化、key_len计算方法)

dcb2f1d13dc661929a6e675356f3be41.png

0c2cbb35ce2e783d71cb732580019ad0.png

ba3f189d88c082a01f12ca12040b60d8.png

e0dcb923c234f3d396756d6b549a29e5.png

复合索引

的意思:先根据第一个字段查比如“张三”,如果通过第一个字段的索引查到了有“张三”,就不用再查第二个字段了,否则需要查第二个字段的索引。

41c1e85891a9a5d859d8f204ddee553a.png

上面创建了一个复合索引

以下执行explain select * from test_k1 where name1='';

索引长度为121(查找name1会使用复合索引,但先会查找name【查找了2个字段的索引】,再去查找name1所以索引长度为121)

name1字段可以为空,索引为用1个字节标示一下是否为空,所以为121

而执行搜索name这个语句,直接用name过些查到了,而且name字段不可以为空,索引的长度为60

afe87d697d9e852f4234df0eed5b4c27.png

df1070f4ed6c977603965038974f7606.png

执行计划ref

const代表常量、其他值代码引用的表

1f60c82d182abfce7ae7fa6204c73789.png

首先2列其中一列没有索引ref为null

753e3ef0909475ad577f88896b33061f.png

加完索引再看(我们研究索引,所以必须加索引)

792f019ffc0d62496ae1c553fa9faca9.png

执行计划 rows

根据表统计信息或者索引选用情况,大致估算出找到所需的记录所需要读取的行数。

21a4cc1ca8c519863986a7095b52a369.png

执行计划 filtered

表示返回结果的行数占需读取行数的百分比, filtered 的值越大越好。

执行计划 Extra

十分重要的额外信息。

Using filesort:MySQL 对数据使用一个额外的排序,而不是按照表内的索引进行排序读取(性能消耗太大)【如果是复合索引,where和order by要按照过些顺序写,不然也会Using filesort,比如where c1=1 order by c3中间跨了c2】

Using temporary:使用临时表保存中间结果,也就是说 MySQL 在对查询结果排序时使用了临时表,常见于order by 或 group by。

Using index:表示 SQL 操作中使用了覆盖索引(Covering Index),避免了访问表的数据行,效率高。

Using index condition:表示 SQL 操作命中了索引,但不是所有的列数据都在索引树上,还需要访问实际的行记录。

Using where:表示 SQL 操作使用了 where 过滤条件(where条件不在索引中或者复合索引跨列查询,所以需要回表查询)

Select tables optimized away:基于索引优化 MIN/MAX 操作或者 MyISAM 存储引擎优化 COUNT(*) 操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即可完成优化。

Using join buffer (Block Nested Loop):表示 SQL 操作使用了关联查询或者子查询,且需要进行嵌套循环计算。

下面通过举例说明。

数据准备:

48304ba5e6f9fe08f3fa1abda7d326ab.png

CREATE TABLE `user` (

`id` int(11) NOT NULL,

`name` varchar(20) DEFAULT NULL,

`sex` varchar(5) DEFAULT NULL,

PRIMARY KEY (`id`),

KEY `name` (`name`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

insert into user values(1, 'shenjian','no');

insert into user values(2, 'zhangsan','no');

insert into user values(3, 'lisi', 'yes');

insert into user values(4, 'lisi', 'no');

48304ba5e6f9fe08f3fa1abda7d326ab.png

数据说明:

用户表:id 主键索引,name 普通索引(非唯一),sex 无索引。

四行记录:其中 name 普通索引存在重复记录 lisi。

Using filesort

explain select * from user order by sex;

fead18f470a269d93b4ea410d43cc543.png

Extra 为 Using filesort 说明,得到所需结果集,需要对所有记录进行文件排序。

这类 SQL 语句性能极差,需要进行优化。

典型的,在一个没有建立索引的列上进行了 order by,就会触发 filesort,常见的优化方案是,在 order by 的列上添加索引,避免每次查询都全量排序。

bad4063424fb06e63b7744da5f62fac9.png

d6eaf669f7d0a360d9a473ab61c0baa6.png

Using temporary

explain select * from user group by name order by sex;

c42f2b37cf914b3ba2ce88907f0b1c2e.png

Extra 为 Using temporary 说明,需要建立临时表(temporary table)来暂存中间结果。

这类 SQL 语句性能较低,往往也需要进行优化。

典型的 group by 和 order by 同时存在,且作用于不同的字段时,就会建立临时表,以便计算出最终的结果集。

临时表存在两种引擎,一种是 Memory 引擎,一种是 MyISAM 引擎,如果返回的数据在 16M 以内(默认),且没有大字段的情况下,使用 Memory 引擎,否则使用 MyISAM 引擎。

Using index

EXPLAIN SELECT id FROM USER;

66eb29686487ba2d8227b68ee879f6dd.png

Extra 为 Using index 说明,SQL 所需要返回的所有列数据均在一棵索引树上,而无需访问实际的行记录。

这类 SQL 语句往往性能较好。

Using index condition

explain select id, name, sex from user where name='shenjian';

77366b99c19a3505be8a39d26e7d362e.png

Extra 为 Using index condition 说明,确实命中了索引,但不是所有的列数据都在索引树上,还需要访问实际的行记录。

这类 SQL 语句性能也较高,但不如 Using index。

Using where

explain select * from user where sex='no';

44745e368badb9924821be3617489726.png

Extra 为 Using where 说明,查询的结果集使用了 where 过滤条件,比如上面的 SQL 使用了 sex = 'no' 的过滤条件

Select tables optimized away

EXPLAIN SELECT MAX(id) FROM USER;

81f67ca088f7ebb3e34b93e0e4748e13.png

比如上面的语句查询 id 的最大值,因为 id 是主键索引,根据 B+Tree 的结构,天然就是有序存放的,所以不需要等到执行阶段再进行计算,查询执行计划生成的阶段即可完成优化。

Using join buffer (Block Nested Loop)

explain select * from user where id in (select id from user where sex='no');

8a41324bd4a308400f1ab11f7091140b.png

Extra 为 Using join buffer (Block Nested Loop) 说明,需要进行嵌套循环计算。内层和外层的 type 均为 ALL,rows 均为4,需要循环进行4*4次计算。

这类 SQL 语句性能往往也较低,需要进行优化。

典型的两个关联表 join,关联字段均未建立索引,就会出现这种情况。常见的优化方案是,在关联字段上添加索引,避免每次嵌套循环计算。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值