快速学会分析SQL执行效率(上)
勤学如春起之苗,不见其增,日有所长。 ——陶潜
本篇一起讨论一下SQL优化,而SQL优化前提要能定位到慢SQL并对其进行分析,因此会跟大家分析如何定位慢查询和如何SQL执行效率。
在我们工作可能遇到某个新功能在测试时需要很久才返回结果,这时就应该分析是不是慢查询导致的。如果确实有慢查询,又应该怎么去分析SQl执行效率呢?本篇就来学习怎么慢查询和怎么去分析SQl执行效率。
1、定位慢SQL
在我们实际工作中,碰到某个功能或者某个接口需要很久才能返回结果,我们就应该去确定是不是慢查询导致的。定位慢SQL有如下两种解决方案:
-
查看慢查询日志确定已执行完的慢查询
-
show processlist 查看正在执行的慢查询
1.1 通过慢查询日志
慢查询:是指在数据库中执行的查询操作所花费的时间超过了预期的阈值,通常是由于查询涉及大量数据、索引未正确使用或者数据库性能不佳等原因导致的。
如果需要定位到慢查询,一般方法是通过慢查询日志来查询的,MySQL的慢查询日志用来记录在MySQL中响应时间超过参数 long_quey_time(默认10秒)设置的值并且扫描记录数不小于 min_examined_row_limit(默认0)的语句,能够帮我们找到执行完的慢查询,方便我们对这些 SQL 进行优化。
知识扩展:
默认情况下,慢查询日志中不会查询管理语句,可通过设置 log_slow_admin_statements = on 让管理语句中的慢查询也记录到慢查询日志中
默认情况下,也不会记录查询时间不超过 long_query_time,但是不使用索引的语句,可通过配置log_queries_not_using_indexes = on 让不使用索引的SQL都被记录到慢查询日志中(即使查询时间没超过long_query_time配置的值)
如果需要使用慢查询日志,一般分为四部,开去慢查询日志、设置慢查询阈值、确定慢查询日志路径,慢查询日志的文件名。
首先开启慢查询日志,由参数 slow_query_log决定是否开启,在MySQL命令行输入下面命令:
mysql> set global slow_query_log = on; //开启
默认环境下,慢查询是关闭的。
设置慢查询时间阈值:
mysql> set global long_query_time = 1 //单位:秒
MySQL中long_query_time的值如何确定呢?
线上业务一般建议把 long_query_time 设置为 1 秒,如果某个业务的 MySQL 要求比较高的 QPS(每分钟执行查询次数),可设置慢查询为 0.1 秒。发现慢查询及时优化或者提醒开发改写。
一般测试环境建议 long_query_time 设置的阀值比生产环境的小,比如生产环境是 1 秒,则测试环境建议配置成 0.5 秒。便于在测试环境及时发现一些效率低的 SQL。
甚至某些重要业务测试环境 long_query_time 可以设置为 0,以便记录所有语句。并留意慢查询日志的输出, 上线前的功能测试完成后,分析慢查询日志每类语句的输出,重点关注 Rows_examined(语句执行期间从存储引擎读取的行数),提前优化。
确定慢查询日志路径
慢查询日志的路径默认是MySQL的数据目录
mysql> show global variables like "datadir";
+---------------+------------------------+
| Variable_name | Value
|
+---------------+------------------------+
| datadir
| /data/mysql/data/3306/ |
+---------------+------------------------+
1 row in set (0.00 sec)
确定慢查询日志的文件名
mysql> show global variables like "slow_query_log_file";
+---------------------+----------------+
| Variable_name | Value
+---------------------+----------------+
| slow_query_log_file | mysql-slow.log |
+---------------------+----------------+
1 row in set (0.00 sec)
根据上面的查询结果,可以直接查看 /data/mysql/data/3306/mysql-slow.log 文件获取已经执行完的慢查询
[root@mysqltest ~]# tail -n5 /data/mysql/data/3306/mysql-slow.log
Time: 2019-05-21T09:15:06.255554+08:00
User@Host: root[root] @ localhost [] Id: 8591152
Query_time: 10.000260 Lock_time: 0.000000 Rows_sent: 1 Rows_examined: 0
SET timestamp=1558401306;
select sleep(10);
这里对上方的执行结果详细描述一下:
-
tail -n5:只查看慢查询文件的最后5行
-
Time:慢查询发生的时间
-
User@Host:客户端用户和IP
-
Query_time:查询时间
-
Lock_time:等待表锁的时间
-
Rows_sent:语句返回的行数
-
Rows_examined:语句执行期间从存储引擎读取的行数
上面这种方式是用系统自带的慢查询日志查看的,如果觉得系统自带的慢查询日志不方便查看,小伙伴们可以使用
pt-query-digest 或者 mysqldumpslow 等工具对慢查询日志进行分析,由于本节重点是找到慢查询,这里就不一 一示例了。
1.2通过show processlist
有时慢查询正在执行,已经导致数据库负载偏高了,而由于慢查询还没执行完,因此慢查询日志还看不到如何语句。此时可以使用 show processlist 命令判断正在执行的慢查询,show processlist 显示哪些线程正在运行。如果有PROCESS权限,则可以看到所有线程,否则,只能看到当前会话的线程。
知识扩展:如果不使用 FULL 关键字,在 info 字段中只显示每个语句的前 100 个字符,如果想看语句的全部 内容可以使用 full 修饰(show full processlist)。
执行结果如下:
mysql> show processlist\G`
`......`
`*************************** 10. row ***************************`
`Id: 7651833`
`User: one`
`Host: 192.168.1.251:52154`
`db: ops`
`Command: Query`
`Time: 3`
`State: User sleep`
`Info: select sleep(10)`
`......`
`10 rows in set (0.00 sec)`
这里对上面结果解释一下:
-
Time:表示执行时间
-
Info:表示 SQL 语句
我们这里可以通过它的执行时间(Time)来判断1是否是慢 SQL。
2、使用explain分析查询
分析SQL执行效率是优化SQL的重要手段,通过上面讲的两种方法,定位到慢查询语句后,我们就要开始分析SQL执行效率了,我们可以通过explain、show profile和trace等诊断工具来分析慢查询。先从讲解explain的使用开始。
Explain可以获取MySQL中SQL语句的执行计划,比如语句是否使用了关联查询、是否使用了索引、扫描行数等。可以帮我们选择更好的索引和写出更优的SQL,使用方法:在查询语句前面加上 explain运行就可以了。
这也是分析SQL是最常用了 ,也是我最推荐的一种分析慢查询的方式。下面我们来看下示例~~
为了便于理解,先创建两张表,建表及数据写入语句如下:
CREATE DATABASE muke;/* 创建测试使用的database,名为muke */
use muke;/* 使用muke这个database */
drop table if exists t1;/* 如果表t1存在则删除表t1 */
/* 创建表t1 */
CREATE TABLE `t1` (
`id` int(11) NOT NULL auto_increment,
`a` int(11) DEFAULT NULL,
`b` int(11) DEFAULT NULL,
`create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '记录创建时间',
`update_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '记录更新时间',
PRIMARY KEY (`id`),
KEY `idx_a` (`a`),
KEY `idx_b` (`b`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
drop procedure if exists insert_t1; /* 如果存在存储过程insert_t1,则删除 */
delimiter ;;
create procedure insert_t1()
begin
/* 创建存储过程insert_t1 */
declare i int; /* 声明变量i */
set i=1; /* 设置i的初始值为1 */
while(i<=1000)do /* 对满足i<=1000的值进行while循环 */
insert into t1(a,b) values(i, i); /* 写入表t1中a、b两个字段,值都为i当前的值 */
set i=i+1; /* 将i加1 */
end while;
end;;
delimiter ; /* 创建批量写入1000条数据到表t1的存储过程insert_t1 */
call insert_t1(); /* 运行存储过程insert_t1 */
drop table if exists t2; /* 如果表t2存在则删除表t2 */
create table t2 like t1; /* 创建表t2,表结构与t1一致 */
insert into t2 select * from t1; /* 将表t1的数据导入到t2 */
下面尝试使用 explain 分析一条 SQL,例子如下:
mysql> explain select * from t1 where b=100;
结果
Explain 的结果各字段解释如下:
列名 | 解析 |
---|---|
id | 查询编号 |
select_type | 查询类型:显示本行是简单还是复杂查询 |
table | 查询表 |
partitions | 匹配的分区:查询将匹配记录所在的分区。仅当使用 partition 关键字时才显示该列。对于非分区表,该值为 NULL。 |
type | 本次查询的表连接类型 |
possible_keys | 可能选择的索引 |
key | 实际用到的索引 |
key_len | 被选择的索引长度:一般用于判断联合索引有多少列被选择了 |
ref | 与索引比较的列 |
rows | 预计需要扫描的行数,对 InnoDB 来说,这个值是估值,并不一定准确 |
filtered | 按条件筛选的行的百分比 |
Extra | 附加信息 |
其中 explain 各列都有各种不同的值,这里介绍几个比较重要列常包含的值:包含 select_type、type 和 Extra。
下面将列出它们常见的一些值,可稍微过一遍,不需要完全记下来,在后续章节分析 SQL 时,可以返回查询本节
内容并对比各种值的区别。
2.1select_type
select_type的值 | 解释 |
---|---|
SIMPLE | 简单查询(不使用关联查询或子查询) |
PRIMARY | 如果包含关联查询或者子查询,则最外层的查询部分标记为primary |
UNION | 联合查询中第二个及后面的查询 |
DEPENDENT UNION | 满足依赖外部的关联查询中第二个及以后的查询 |
UNION RESULT | 联合查询的结果 |
SUBQUERY | 子查询的第一个查询 |
DEPENDENT SUBQUERY | 子查询中的第一个查询,并且依赖外部查询 |
DERIVED | 用到派生表的查询 |
MATERIALIZED | 被物化的子查询 |
UNCACHEABLE SUBQUERY | 一个子查询的结果不能被缓存,必须重新评估外层查询的每一行 |
UNCACHEABLE UNION | 关联查询第二个或后面的语句属于不可缓存的子查询 |
2.2 type
下表的这些情况,查询性能从上到下依次是最好到最差。
type的值 | 解释 |
---|---|
system | 查询对象表只有一行数据,且只能用于 MyISAM 和 Memory 引擎的表,这是最好的情况 |
const | 基于主键或者唯一索引查询,最多返回一条结果 |
eq_ref | 使用的是唯一索引,对于每个索引键,表中只有一条记录与之匹配。常用于多表连接 |
ref | 基于普通索引的等值查询,或者表间等值连接 |
fulltext | 全文检索 |
ref_or_null | 表连接类型是 ref,但进行扫描的索引列中可能包含 NULL 值 |
range | 只检索给定范围的行。where语句中出现了between、<、>、in等的查询 |
index | 全索引扫描 |
ALL | 全表扫描,不走索引 |
2.3 Extra
下面只列出常见情况。
Extra | 解释 | 例子 |
---|---|---|
Using index | 使用覆盖索引 | explain select a from t1 where a=111; |
Using where | 使用where语句来处理结果 | explain select * from t1 where create_time='2024-01-18 09:54:36'; |
Using temporary | 需要创建一个临时表来存储结构,通常发生对没有索引的列进行 GROUP BY时 | EXPLAIN SELECT create_time, COUNT(id) as count FROM t1 GROUP BY create_time; |
Using filesort | 将用外部排序而不是索引排序,数据较小时从内存排序,否则需要在磁盘完成排序 | EXPLAIN SELECT * FROM t1 ORDER BY create_time; |
3 总结
今天我分享的关于定位慢 SQL 及使用 explain 分析慢 SQL 到这里就结束了。本节知识点总结如下:
本篇首先讲到如何定位慢 SQL:
-
一种方法是查看慢查询日志
-
另一种方法是 show process 查看正在执行的 SQL
再讲到通过 explain 分析慢 SQL,explain 会返回很多字段,其中 select_type、type、key、rows、Extra 是重点关注项。
在工作中及面试时,SQL 性能优化都是我们经常遇到的问题,要想做好性能优化,我们必须学会使用 SQL 优化时
需要的工具,进行定位和分析。由于篇幅的问题,本小节只介绍了 explain 工具的使用,在下节将补充另外两种分
析慢查询的工具:show profile 和 trace。在后面我会再讲解 SQL 优化的一些知识点,相信小伙伴们 SQL 性能优化时一定可以越来越熟练。
最后小伙伴们可以将处理问题时的心得体会进行总结,也欢迎给我留言分享,我们一起来交流、学习、进步。
4 问题
你在平常工作中是怎么降低慢查询在生产环境出现的概率?可以在评论区讨论。
5 参考资料
《深入浅出 MySQL》(第2版):第 18 章第 1 节