用好 explain 妈妈再也不用担心我的 SQL 慢了

大家好,我是聪,一个乐于分享的小小程序员。在不久之前我写了一个慢 SQL 分析工具,可以用来分析 Java Mybatis 项目的 SQL 执行情况,其中刚好涉及到了 explain 的使用。感兴趣的可以了解一下。

Github 地址⭐:https://github.com/lhccong/sql-slow-mirror

那么开始我们今天的主题吧,今天的聪碰见了一个当面试官的朋友问我,用过 explain 吗?说说怎么分析的?

12.jpg

聪:一脸正经的回答道💡

聪:你好面试官,我当然用过 explain,我平时都会那它去查看 SQL 语句是否还能优化。接下来我从主要属性跟实际例子来讲解:

主要的属性

1) 🌱 id

查询中每个 SELECT 子句的标识符。简单查询的 id 通常为 1,复杂查询(如包含子查询或 UNION)的 id 会有多个。

2) 🌱 select_type

描述查询的类型。比如:简单查询显示为 SIMPLE,子查询显示为 SUBQUERY,UNION 中的第二个和后续查询显示为 UNION

3)🌱 table

表名称这个就不用再详细解释了吧哈哈。

4) 🌱 partitions

表示查询涉及到的分区。如果你有使用分区表的话才需要关注此字段。

5) 🌱 type(重点记忆⭐)

表示访问的类型,这里也可以看出你的 SQL 的性能。可能的值从最好到最差包括:systemconsteq_refrefrangeindexALL。其中 ALL 表示全表扫描,效率最低。

  • system:

    表示查询的表只有一行(系统表)。这是一个特殊的情况,不常见。

  • const:

    表示查询的表最多只有一行匹配结果。这通常发生在查询条件是主键唯一索引,并且是常量比较,以下是一个使用主键查找的例子:

    EXPLAIN SELECT * FROM employees WHERE employee_id = 12345;
    
  • eq_ref:

    表示对于每个来自前一张表的行,MySQL 仅访问一次这个表。这通常发生在连接查询中使用主键或唯一索引的情况下,例子如下:

    EXPLAIN SELECT * FROM employees e JOIN departments d ON e.department_id = d.department_id;
    
  • ref:

    MySQL 使用非唯一索引扫描来查找行。查询条件使用的索引是非唯一的(如普通索引),例子如下使用了非唯一索引进行查找:

    EXPLAIN SELECT * FROM employees WHERE department_id = 5;
    
  • range:表示 MySQL 会扫描表的一部分,而不是全部行。范围扫描通常出现在使用索引的范围查询中(如 BETWEEN>, <, >=, <=)。下面是范围查询:

    EXPLAIN SELECT * FROM employees WHERE salary BETWEEN 50000 AND 100000;
    
  • index:表示 MySQL 扫描索引中的所有行,而不是表中的所有行。即使索引列的值覆盖查询,也需要扫描整个索引。以下是使用索引扫描例子:

    EXPLAIN SELECT name FROM employees;
    
  • all(性能最差):表示 MySQL 需要扫描表中的所有行,即全表扫描。这通常出现在没有索引的查询条件中。以下是全表扫描例子:

    EXPLAIN SELECT * FROM employees;
    
6) 🌱 possible_keys

表示查询可能使用的索引列表。

7) 🌱 key

实际使用索引的长度。如果没有使用索引,该字段显示为 NULL

8) 🌱 key_len

这个字段表示使用的索引的长度。该值是根据索引的定义和查询条件计算的。

9) 🌱 rows

MySQL 会估计为了找到所需的行,需要读取的行数。该值是一个估计值,不是精确值。

10)🌱 filtered

显示查询条件过滤掉的行的百分比。一个高百分比表示查询条件的选择性好。

11)🌱 Extra

额外信息,如 Using index(表示使用覆盖索引)、Using where(表示使用 WHERE 条件进行过滤)、Using temporary(表示使用临时表)、Using filesort(表示需要额外的排序步骤)。

12.jpg

看完这个是不是一目了然了捏,那么接下来跟着我看看实际的分析例子吧!!

实际例子🌰

1.创建 employees 表
CREATE TABLE employees (
    employee_id INT PRIMARY KEY,
    first_name VARCHAR(50),
    last_name VARCHAR(50),
    department_id INT,
    salary DECIMAL(10, 2),
    hire_date DATE,
    INDEX (department_id)
);

我们要执行以下查询来查找部门 ID 为 5 且薪水在 50000 到 100000 之间的员工,并按薪水降序排序:

SELECT employee_id, first_name, last_name, salary
FROM employees
WHERE department_id = 5 AND salary BETWEEN 50000 AND 100000
ORDER BY salary DESC;
2.我们先使用 explain 分析计划进行分析:
EXPLAIN SELECT employee_id, first_name, last_name, salary
FROM employees
WHERE department_id = 5 AND salary BETWEEN 50000 AND 100000
ORDER BY salary DESC;

输出结果如下:

idselect_typetablepartitionstypepossible_keyskeykey_lenrefrowsfilteredExtra
1SIMPLEemployeesNULLrefdepartment_iddepartment_id4const500020.00Using where; Using filesort
3.分析执行计划

从执行计划中看出,typeref,表示使用了 department_id 索引,这是个非唯一索引。keydepartment_id 这个索引,而且 rows 为 5000,表示扫描了 5000 行匹配的 department_id = 5 的条件。从 Extra 看出在应用 WHERE 条件后,还需要进行文件排序来满足 ORDER BY 子句。

4.找出问题

尽管查询使用了索引,但由于索引不完全覆盖查询的条件和排序,查询需要进行额外的文件排序。这可能会导致性能瓶颈,特别是在结果集较大时。

5.优化解决它!

创建复合索引

创建一个包含 department_idsalary 的复合索引,这样可以覆盖查询的 WHEREORDER BY 条件:

CREATE INDEX idx_department_salary ON employees (department_id, salary);

复合索引可以使查询在扫描 department_id 列时,同时按 salary 列排序,避免额外的文件排序。

再次执行计划分析

优化后的 EXPLAIN 输出如下:

idselect_typetablepartitionstypepossible_keyskeykey_lenrefrowsfilteredExtra
1SIMPLEemployeesNULLrangeidx_department_salaryidx_department_salary5NULL500100.00Using where
6.分析优化后的结果

从新的 EXPLAIN 输出中可以看出:

  • type: range,表示使用范围扫描,这是个相对高效的访问类型。
  • key: idx_department_salary,表示实际使用了复合索引。
  • rows: 500,估计读取的行数减少了,因为索引更精确地覆盖了查询条件。
  • Extra: 仅显示 Using where,不再需要文件排序,因为索引已经覆盖了排序需求。

12.jpg

是不是分析起来很简单咧,完结撒花!!!!,除了新增联合索引的方式,你们还知道什么优化策略吗?

  • 45
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值