【mysql】记一次用explain优化sql过程

最新推荐文章于 2023-09-22 10:47:15 发布

吃鱼的小朋

最新推荐文章于 2023-09-22 10:47:15 发布

阅读量257

点赞数

分类专栏：数据库文章标签： mysql

本文链接：https://blog.csdn.net/wphero/article/details/107773317

版权

数据库专栏收录该内容

4 篇文章 0 订阅

订阅专栏

情景再现

接手别人项目，发现一个会员分页列表查询很慢，估计3-4s，sql大致如下：

SELECT
	a.*,
	( SELECT v.visit_time FROM tb_visit v WHERE v.member_id = a.id ORDER BY v.visit_time DESC LIMIT 1 ) AS visit_time,
	( SELECT SUM( j.money ) FROM tb_consumption j WHERE j.member_id = a.id ) AS money
FROM
	tb_member a
	LEFT JOIN tb_branch b ON a.branch_id = b.id
	LEFT JOIN tb_city c ON a.city_id = c.id
	LEFT JOIN tb_visit d ON a.id = d.member_id 
WHERE
	a.is_delete = '1' 
	AND a.shop_id = '1df5c9e33996427e98e067e16b996d40' 
GROUP BY
	a.id 
ORDER BY
	a.col1 ASC,
	a.create_time DESC 
	LIMIT 0,10

耗时3s，给人体验非常不好，恰好看到运行按钮旁有个“解释”功能

运行效果如下

在没详细了解explain之前看到这么多“all”大致也该明白

Explain详解

explain 命令可查看该sql有没有用上索引，有没有全表扫描，以及优化器采用何种查询策略等等。

字段详解

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传unmg-Bv2RYkzi-1596418523110)(img-unsZ0Ilc-15964184436956)]

一、id

这是最好理解的，就是SQL执行的顺序的标识,SQL从大到小的执行。
id相同时，执行顺序由上至下。
如果是子查询，id的序号会递增，id值越大优先级越高，越先被执行。
id如果相同，可以认为是一组，从上往下顺序执行；在所有组中，id值越大，优先级越高，越先执行。

二、select_type

表示查询的类型
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-miSIc7Zj-1596418451372)(http://47.94.3.87:28083/upload/20200731_17370480.png)]

三、table

表示对应行正在访问哪一个表，表名或者别名

四、type（重要）

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UbPekZm2-1596418451374)(http://47.94.3.87:28083/upload/20200731_17384173.png)]

五、possible_keys

指出MySQL能使用哪个索引在表中找到记录，查询涉及到的字段上若存在索引，则该索引将被列出，但不一定被查询使用（该查询可以利用的索引，如果没有任何索引显示 null）
该列完全独立于EXPLAIN输出所示的表的次序。这意味着在possible_keys中的某些键实际上不能按生成的表次序使用。
如果该列是NULL，则没有相关的索引。在这种情况下，可以通过检查WHERE子句看是否它引用某些列或适合索引的列来提高你的查询性能。如果是这样，创造一个适当的索引并且再次用EXPLAIN检查查询

六、Key（重要）

实际使用的索引，如果为NULL，则没有使用索引。
查询中如果使用了覆盖索引，则该索引仅出现在key列表中

七、key_len

表示索引中使用的字节数，可通过该列计算查询中使用的索引的长度（key_len显示的值为索引字段的最大可能长度，并非实际使用长度，即key_len是根据表定义计算而得，不是通过表内检索出的）
不损失精确性的情况下，长度越短越好

八、ref

显示索引的那一列被使用了，如果可能，是一个常量const。

九、rows（重要）

估算出结果集行数，表示MySQL根据表统计信息及索引选用情况，估算的找到所需的记录所需要读取的行数

十、Extra

该列包含MySQL解决查询的详细信息,有以下几种情况：

Using where:不用读取表中所有信息，仅通过索引就可以获取所需数据，这发生在对表的全部的请求列都是同一个索引的部分的时候，表示mysql服务器将在存储引擎检索行后再进行过滤
Using temporary（效率低）：表示MySQL需要使用临时表来存储结果集，常见于排序和分组查询，常见 group by ; order by
Using filesort（效率低）：当Query中包含 order by 操作，而且无法利用索引完成的排序操作称为“文件排序”
Using join buffer：改值强调了在获取连接条件时没有使用索引，并且需要连接缓冲区来存储中间结果。如果出现了这个值，那应该注意，根据查询的具体情况可能需要添加索引来改进能。
Impossible where：这个值强调了where语句会导致没有符合条件的行（通过收集统计信息不可能存在结果）。
Select tables optimized away：这个值意味着仅通过使用索引，优化器可能仅从聚合函数结果中返回一行
No tables used：Query语句中使用from dual 或不含任何from子句

优化方法

1、select_type

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HCJlIgKr-1596418451376)(http://47.94.3.87:28083/upload/20200731_18032349.png)]
select_type 出现 DEPENDENT SUBQUERY，根据table找到sql语句：[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dlsGVyuX-1596418451378)(http://47.94.3.87:28083/upload/20200731_17555777.png)]
这两个子查询sql用于获取会员的消费总额和到访记录，根据上文解释：子查询的第一个SELECT，取决于外面的查询，也就是说id为2、3的子查询取决于di=1，table=a外层主查询，它意味先执行第一个sql，得到rows=107的一个大结果集，然后大结果集的每一条记录再与子查询sql组成新sql，等于说要执行107*2次。
考虑到此处业务不是很复杂，把这两项sql剥离出去，单独写个两个sql，去掉这两个sql的运行结果：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FrnMtRRB-1596418451380)(http://47.94.3.87:28083/upload/20200731_18111665.png)]
实际业务测试也缩减到0.08s（原来3s左右）

2、type

效率由大到小：NULL > system > const > eq_ref > ref > range > index > ALL
######（1） ALL
可以看到explain后有3处的type都是ALL，all，全表扫描，是一种非常暴力和原始的查找方法，非常的耗时而且低效。用all去查找数据就好比这样的一个情形：S学校有俩万人，我告诉你你给我找到小明，然后你怎么做呢！你当然是把全校俩万人挨个找一遍，即使你很幸运第一个人便找到了小明，但是你仍然不能停下，因为你无法确认是否有另外一个小明存在，直到你把俩万人找完为止。所以，基本所有情况，我们都要避免这样类型的查找，除非你不得不这样做。
######（2） index
这种连接类型只是另外一种形式的全表扫描，只不过它的扫描顺序是按照索引的顺序。这种扫描根据索引然后回表取数据，和all相比，他们都是取得了全表的数据，而且index要先读索引而且要回表随机取数据，因此index不可能会比all快（取同一个表数据），但为什么官方的手册将它的效率说的比all好，唯一可能的原因在于，按照索引扫描全表的数据是有序的。这样一来，结果不同，也就没法比效率的问题了。

（3）range

range指的是有范围的索引扫描，相对于index的全索引扫描，它有范围限制，因此要优于index。关于range比较容易理解，需要记住的是出现了range，则一定是基于索引的。同时除了显而易见的between，and以及’>’,’<'外，in和or也是索引范围扫描。

id主键：唯一索引、主键索引

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Bxzcc1lW-1596418451381)(http://47.94.3.87:28083/upload/20200731_22514834.png)]

name:无索引

(4)ref

使用了非主键和唯一的索引。其实，意思就是虽然使用了索引，但该索引列的值并不唯一，有重复。这样即使使用索引快速查找到了第一条数据，仍然不能停止，要进行目标值附近的小范围扫描。但它的好处是它并不需要扫全表，因为索引是有序的，即便有重复值，也是在一个非常小的范围内扫描。下面为了演示这种情形，给会员表中的name列添加一个普通的key（值允许重复）

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YaNRKm7J-1596418451385)(http://47.94.3.87:28083/upload/20200731_23062529.png)]

（5）ref_eq[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZmNKSpl9-1596418451386)(http://47.94.3.87:28083/upload/20200731_23162322.png)]

ref_eq 与 ref相比牛的地方是，它知道这种类型的查找结果集只有一个？什么情况下结果集只有一个呢！那便是使用了主键或者唯一性索引进行查找的情况，比如根据学号查找某一学校的一名同学，在没有查找前我们就知道结果一定只有一个，所以当我们首次查找到这个学号，便立即停止了查询。这种连接类型每次都进行着精确查询，无需过多的扫描，因此查找效率更高，当然列的唯一性是需要根据实际情况决定的。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ViMCAV03-1596418451387)(http://47.94.3.87:28083/upload/20200731_23163074.png)]

（6）const

查找主键索引，返回的数据至多一条（0或者1条）。属于精确查找，通常情况下，如果将一个主键放置到where后面作为条件查询，mysql优化器就能把这次查询优化转化为一个常量。至于如何转化以及何时转化，这个取决于优化器。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SOz7l6rN-1596418451388)(http://47.94.3.87:28083/upload/20200731_2323094.png)]

3、Extra

根据extra显示Using temporary; Using filesort，临时表和文件排序，两个都没用到索引，查询效率低；其次，查询字段不在索引上，没有使用覆盖索引（SQL只需要通过索引就可以返回查询所需要的数据，而不必通过二级索引查到主键之后再去查询数据。），需要通过索引回表查询；也有数据分布的原因。
添加一个联合索引便可以避免回表和文件排序，利用覆盖索引提升查询速度，同时利用索引完成排序。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传i7mg-YXaDkfrX-1596418534802)(img-i7nzBZ0M-1596418445191)(http://47.94.3.87:28083/upload/20200731_23523068.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JK7qDI2s-1596418544385)(img-ai1Pxvsa-1596418451393)

吃鱼的小朋

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【mysql】记一次用explain优化sql过程

情景再现接手别人项目，发现一个会员分页列表查询很慢，估计3-4s，sql大致如下：SELECT a.*, ( SELECT v.visit_time FROM tb_visit v WHERE v.member_id = a.id ORDER BY v.visit_time DESC LIMIT 1 ) AS visit_time, ( SELECT SUM( j.money ) FROM tb_consumption j WHERE j.member_id = a.id ) AS moneyF
复制链接

扫一扫

专栏目录