【展开说说】MySQL调优系列之执行过程 explain

MySQL调优系列

MySQL调优之性能监控

执行计划

在企业的应用场景中,为了知道优化 SQL 语句的执行,需要查看 SQL 语句的具体执行过程,以加快 SQL 语句的执行效率。
可以使用 explain+SQL 语句来模拟优化器执行 SQL 查询语句,从而知道 mysql 是如何处理 sql 语句的,查询有没有走索引
执行计划中包含的信息

ColumnMeaning
idThe SELECT identifier
select_typeThe SELECT type
tableThe table for the output row
partitionsThe matching partitions
typeThe join type
possible_keysThe possible indexes to choose
keyThe index actually chosen
key_lenThe length of the chosen key
refThe columns compared to the index
rowsEstimate of rows to be examined
filteredPercentage of rows filtered by table condition
extraAdditional information

id

select 查询的序列号,包含一组数字,表示查询中执行 select 子句或者操作表的顺序。

id号分为三种情况:

  1. 如果id相同,那么执行顺序从上到下

    explain select * from emp e join dept d on e.deptno = d.deptno join salgrade sg on e.sal between sg.losal and sg.hisal;
    

    在连接查询的执行计划中,每个表都会对应一条记录,这些记录的id列的值是相同的;出现在前面的表表示驱动表,出现在后面的表表示被驱动表。

  2. 如果id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行。

    explain select * from emp e where e.deptno in (select d.deptno from dept d where d.dname = 'SALES');
    

    在这里插入图片描述
    查询优化器可能对涉及子查询的查询语句进行重写,从而转换为连接查询(半连接)。
    在这里插入图片描述
    虽然查询语句中包含一个子查询,但是执行计划中s1和s2表对应的记录的id值全部是1.这就表明查询优化器将子查询转换为了连接查询。

  3. id相同和不同的,同时存在:相同的可以认为是一组,从上往下顺序执行,在所有组中,id值越大,优先级越高,越先执行。

  4. id 为 null 的情况。比如下面这个查询:
    在这里插入图片描述
    UNION 子句会把多个查询的结果集合并起来并对结果集中的记录进行去重。MySQL 使用的是内部临时表,UNION 子句为了把 id 为 1 的查询和 íd 为 2 的查询的结果集合并起来并去重,在内部创建了一个名为<union1,2>的临时表。íd 为 NULL 表明这个临时表是为了合并两个查询的结果集而创建。
    与UNlON比起来,UNlON ALL就不需要对最终的结果集进行去重.它只是单纯地把多个查询结果集中的记录合并成一个并返回给用户,所以也就不需要使用临时表.所以在包含UNlON ALL子句的查询的执行计划中,就没有那个íd为NULL的记录,如下所示:
    在这里插入图片描述

select_type

主要用来分辨查询的类型,是普通查询还是联合查询还是子查询

select_type ValueMeaning
SIMPLESimple SELECT (not using UNION or subqueries)
PRIMARYOutermost SELECT
UNIONSecond or later SELECT statement in a UNION
DEPENDENT UNIONSecond or later SELECT statement in a UNION, dependent on outer query
UNION RESULTResult of a UNION.
SUBQUERYFirst SELECT in subquery
DEPENDENT SUBQUERYFirst SELECT in subquery, dependent on outer query
DERIVEDDerived table
UNCACHEABLE SUBQUERYA subquery for which the result cannot be cached and must be re-evaluated for each row of the outer query
UNCACHEABLE UNIONThe second or later select in a UNION that belongs to an uncacheable subquery (see UNCACHEABLE SUBQUERY)
  • simple:简单的查询,不包含子查询和union

    explain select * from emp;
    
  • primary:查询中若包含任何复杂的子查询,最外层查询则被标记为Primary

    explain select staname,ename supname from (select ename staname,mgr from emp) t join emp on t.mgr=emp.empno ;
    
  • union:若第二个select出现在union之后,则被标记为union

    explain select * from emp where deptno = 10 union select * from emp where sal >2000;
    
  • dependent union:跟union类似,此处的depentent表示union或union all联合而成的结果会受外部表影响

    explain select * from emp e where e.empno  in ( select empno from emp where deptno = 10 union select empno from emp where sal >2000)
    
  • union result:从union表获取结果的select

    explain select * from emp where deptno = 10 union select * from emp where sal >2000;
    
  • subquery:在select或者where列表中包含子查询

    explain select * from emp where sal > (select avg(sal) from emp) ;
    
  • dependent subquery:subquery的子查询要受到外部表查询的影响

    explain select * from emp e where e.deptno in (select distinct deptno from dept);
    
  • DERIVED: from子句中出现的子查询,也叫做派生类,

    explain select staname,ename supname from (select ename staname,mgr from emp) t join emp on t.mgr=emp.empno;
    
  • UNCACHEABLE SUBQUERY:表示使用子查询的结果不能被缓存

    explain select * from emp where empno = (select empno from emp where deptno=@@sort_buffer_size);
    
  • uncacheable union:表示union的查询结果不能被缓存

table

对应行正在访问哪一个表,表名或者别名,可能是临时表或者union合并结果集

  1. 如果是具体的表名,则表名从实际的物理表中获取数据,当然也可以是表的别名
  2. 表名是derivedN的形式,表示使用了id为N的查询产生的衍生表
  3. 当有union result的时候,表名是union n1,n2等的形式,n1,n2表示参与union的id

type

type显示的是访问类型,访问类型表示我是以何种方式去访问我们的数据,最容易想的是全表扫描,直接暴力的遍历一张表去寻找需要的数据,效率非常低下,访问的类型有很多,效率从最好到最坏依次是:
system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
一般情况下,得保证查询至少达到range级别,最好能达到ref

all

全表扫描,一般情况下出现这样的sql语句而且数据量比较大的话那么就需要进行优化。

	explain select * from emp;
index

全索引扫描这个比 all 的效率要好,主要有两种情况,一种是当前的查询时覆盖索引,即我们需要的数据在索引中就可以索取,或者是使用了索引进行排序,这样就避免数据的重排序。

	explain  select empno from emp;
range

使用索引执行查询时,对应的扫描区间为若干个单点扫描区间或者范围扫描区间的访问方法称为 range (仅包含一个单点扫描区间的访问方法不能称为 range 访问方法,扫描区间为 (-∞,+∞) 的访问方法也不能称为 range 访问方法)。在指定范围内进行查询,这样避免了 index 的全索引扫描,适用的操作符: =, <>, >, >=, <, <=, IS NULL, BETWEEN, LIKE, IN() 。

	explain select * from emp where empno between 7000 and 7500;
index_subquery

利用索引来关联子查询,不再扫描全表。

	explain select * from emp where emp.job in (select job from t_job);
unique_subquery

该连接类型类似与 index_subquery,使用的是唯一索引。

	 explain select * from emp e where e.deptno in (select distinct deptno from dept);
index_merge

在查询过程中需要多个索引组合使用

ref_or_null

不仅想找出某个二级索引列的值等于某个常数的记录,而且还想把该列中值为 NULL 的记录也找出来,比如下面这个查询:

	explain select * from emp e where  e.mgr is null or e.mgr=7369;

当使用二级索引而不是全表扫描的方式执行该查询时,对应的扫描区间就是[NULL,NULL]
以及[‘abc’, ‘abc’] ,此时执行这种类型的查询所使用的访问方法就称为ref_or_null。可以看到 ref_or_null 访问方法只是比 ref 访问方法多扫描了一些值为 NULL 的二级索引记录(值为 NULL 的记录会被放在索引的最左边)。

ref

搜索条件为二级索引列与常数进行等值比较,形成的扫描区间为单点扫描区间, 采用二级索引来执行查询的访问方法称为 ref。

	 SELECT * FROH xxx_table WHERE key1 = 'abc';

对于普通的二级索引来说,通过索引列进行等值比较后可能会匹配到多条连续的二级索引记录,而不是像主键或者唯一二级索引那样最多只能匹配一条记录。所以这种 ref 访问方法比 const 差了那么一点。

  • 在二级索引列允许存储 NULL 值时,无论是普通的二级索引,还是唯一二级索引,它
    们的索引列并不限制 NULL 值的数量,所以在执行包含 “key IS NULL” 形式的搜索条件的查询时,最多只能使用 ref 访问方法, 而不能使用 const 访问方法。
  • 对于索引列中包含多个列的二级索引来说,只要最左边连续的列是与常数进行等值比较,就可以采用 ref 访问方法。如下所示:
		SELECT * FROM single_table WHERE key_part1 = 'AAA';
		SELECT * FROM single_table WHERE key_part1 = 'AAA' and key_part2 = 'BBB';
		SELECT * FROM single_table WHERE key_part1 = 'AAA' and key_part2 = 'BBB' and key_part3 = 'CCC';

如果索引列中最左边连续的列不全部是等值比较的话,它的访问方法就不能称为 ref 了。

		SELECT * FROM single_table WHERE key_part1 = 'AAA' and key_part2 > 'BBB';
eq_ref

用于联表查询的状况,按联表的主键或惟一键联合查询。

	explain select * from emp,emp2 where emp.empno = emp2.empno;
const

通过主键或者唯一二级索引列来定位一条记录的访问方法定义为 const(意思是常数级别的, 代价是可以忽略不计的) 。不过这种 const 访问方法只能在主键列或者唯一二级索引列与一个常数进行等值比较时才有效。如果主键或者唯一二级索引的索引列由多个列构成,则只有在索引列中的每一个列都与常数进行等值比较时,这个const访问方法才有效(这是因为只有在该索引的每一个列都采用等值比较时, 才可以保证最多只有一条记录符合搜索条件)。
对于唯一二级索引列来说, 在查询列为 NULL 值时, 情况比较特殊。比如下面这样:

	SELECT * FROM single table WHERE key2 IS NULL

因为唯一二级索引列并不限制 NULL 值的数量, 所以上述语句可能访问到多条记录。

system

表只有一行记录(等于系统表),这是const类型的特例,平时不会出现。

possible_keys

显示可能应用在这张表中的索引,一个或多个,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用

explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10;

key

实际使用的索引,如果为null,则没有使用索引,查询中若使用了覆盖索引,则该索引和查询的select字段重叠。

explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10;

key_len

表示索引中使用的字节数,可以通过key_len计算查询中使用的索引长度,在不损失精度的情况下长度越短越好。

explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10;

ref

显示索引的哪一列被使用了,如果可能的话,是一个常数

explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10;

rows

根据表的统计信息及索引使用情况,大致估算出找出所需记录需要读取的行数,此参数很重要,直接反应的sql找了多少数据,在完成目的的情况下越少越好

explain select * from emp;

extra

包含额外的信息。

  • using filesort:说明mysql无法利用索引进行排序,只能利用排序算法进行排序,会消耗额外的位置

    explain select * from emp order by sal;
    
  • using temporary:建立临时表来保存中间结果,查询完成之后把临时表删除

    explain select ename,count(*) from emp where deptno = 10 group by ename;
    
  • using index:这个表示当前的查询时覆盖索引的,直接从索引中读取数据,而不用访问数据表。如果同时出现using where 表名索引被用来执行索引键值的查找,如果没有,表面索引被用来读取数据,而不是真的查找

    explain select deptno,count(*) from emp group by deptno limit 10;
    
  • using where:使用where进行条件过滤

    explain select * from t_user where id = 1;
    
  • using join buffer:使用连接缓存

  • impossible where:where语句的结果总是false

    explain select * from emp where empno = 7469;
    

参考资料

  • MySQL官网
  • 《MySQL是怎样运行的》
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值