SQL查询全揭秘：从流程到优化，EXPLAIN命令的完美应用

散一世繁华，颠半世琉璃

已于 2024-07-21 22:33:20 修改

阅读量2.8k

点赞数 24

分类专栏： MySQL 文章标签： sql 数据库

于 2024-07-20 22:57:12 首次发布

本文链接：https://blog.csdn.net/qq_51447436/article/details/140578117

版权

MySQL 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1.解密SQL查询全过程

在现代应用程序中，SQL查询扮演这至关重要的角色。因此，理解SQL查询从客户端到最终返回数据的整个过程，不仅有助于我们更好地优化查询功能，还能帮助我们更高效地排除故障。让我们进一步揭开SQL查询地神秘面纱（以MySQL为例），深入了解这一复杂但至关重要地过程！

1.1 建立连接

我们知道由于MySQL是开源的，他有非常多种类的客户端：navicat,mysql front,jdbc,SQLyog等非常丰富的客户端,这些客户端要向mysql发起通信都必须先跟Server端建立通信连接，而建立连接的工作就是有连接器完成的。
首先，你会先连接到这个数据库上，这时候接待你的就是连接器。连接器负责跟客户端建立连接、获取权限、维持和管理连接。连接命令一般是这么写的：

mysql -h host[数据库地址]  -u root[用户] -p 123456[密码]

经过TCP三次握手之后，连接器就开始认证你的身份，这个时候用的就是你输入的用户名和密码。
1、如果用户名和密码校验不通过，你就会收到一个“Access denied for user”的错误，然后客户端程序结束执行。
2、如果用户名和密码校验通过，连接器就会收到权限表里查出你拥有的权限。之后，这个，这个连接里面的权限判断逻辑都将会依赖此时读到的权限。
注意：客户端如果长时间不发送command到Server端，连接器就会自动将它断开。这个时间是由参数 wait_timeout 控制的，默认值是 8 小时。

1.2 查询缓存

连接建立完成后，你就可以执行 select 语句了。执行逻辑就会来到第二步：查询缓存。
MySQL 拿到一个查询请求后，会先到查询缓存看看，之前是不是执行过这条语句。之前执行过的语句及其结果可能会以 key-value对的形式，被直接缓存在内存中。key 是查询的语句，value 是查询的结果。如果你的查询能够直接在这个缓存中找到 key，那么这个 value 就会被直接返回给客户端。
如果语句不在查询缓存中，就会继续后面的执行阶段。执行完成后，执行结果会被存入查询缓存中。你可以看到，如果查询命中缓存，MySQL 不需要执行后面的复杂操作，就可以直接返回结果，这个效率会很高。
但是，查询缓存会因为更新频繁失效，因为只要一个表有更新操作，那么这个表的查询缓存就会被清空。
这样就显得很鸡肋，我们可以通过将参数 query_cache_type 设置成 DEMAND，来关闭查询缓存。
需要指出，MySQL 8.0版本直接将查询缓存的整块功能删掉了，8.0开始彻底没有这个功能了。

1.3 查询解析

如果查询缓存没有命中，接下来就需要进入正式的查询阶段了。因为客户端程序发送过来的请求只是一段文本而已，所以MySQL服务器程序首先要对这段文本做分析，判断请求的语法是否正确，然后从文本中将要查询的表、各种查询条件都提取出来放到MySQL服务器内部使用的一些数据结构上来。

在SQL查询解析过程中，语法分析和词法分析是两个关键步骤，主要目的是将SQL查询语句转换为计算机能够理解和处理的内部表示形式。生成语法树（也称为解析树）是这两个步骤的结果，它提供了一种结构化的表示形式，使得后续的查询优化和执行更加高效。

词法分析（Lexical Analysis）
- 目的：将输入的SQL查询字符串分解成最小的语言单位，称为词法单元（Token）。
- 过程：词法分析器（Lexer）扫描输入的SQL字符串，将其分解为标识符（如表名、列名）、关键字（如SELECT、FROM、WHERE）、操作符（如=、>、<）等。
- 示例：
```
SELECT username,ismale from userinfo WHERE 1=1 AND age > 20 AND level > 5；
```
  词法分析的结果可能是：[SELECT, username,ismale, FROM, userinfo, WHERE,1,=,1,age,>,20,and,level,>,5,;]
语法分析（Syntax Analysis）
- 目的：根据SQL语法规则，将词法单元序列组织成一个有意义的结构，生成语法树（解析树）。
- 过程：语法分析器（Parser）根据预定义的SQL语法规则，检查词法单元的顺序和组合是否符合语法要求。如果符合，生成语法树；否则，抛出语法错误。
- 示例：
```
SELECT username,ismale from userinfo WHERE 1=1 AND age > 20 AND level > 5；
```
  语法分析器会检查SELECT、FROM、WHERE等关键字的正确使用，并构建一棵表示查询结构的语法树。
生成语法树

1.4 优化器

经过了语法解析，MySQL 就知道你要做什么了。
在开始执行之前，还要先经过查询优化的处理。优化处理是指在表里面有多个索引的时候，决定使用哪个索引;或者在一个语句有多表关联(join)的时候，决定各个表的连接顺序。可以使用EXPLAIN语句来查看某个语句的执行计划。
大部分优化的逻辑是基于成本的优化。在MySQL中一条查询语句的执行成本是由两个方面组成的：
1.I/O成本 ：从磁盘到内存这个加载的过程损耗的时间称之为I/O成本。
2.CPU成本 ：读取以及检测记录是否满足对应的搜索条件、对结果集进行排序等这些操作损耗的时间称之为CPU成本。
总结：优化器（Optimizer）主要根据执行成本来对解析树进行优化。包括选择最优的执行计划，如使用索引、选择合适的连接算法等。

1.5 执行器

在数据库管理系统（DBMS）中，执行器（Executor）是负责实际执行SQL查询操作的组件。它的主要任务是根据查询优化器优化后的执行计划，调用存储引擎的API 执行实际的数据读取或修改操作，包括主键索引查询，索引下推等。
在这里插入图片描述

2.使用EXPLAIN优化SQL

使用 EXPLAIN 进行SQL优化的步骤是数据库性能优化的一个重要环节。EXPLAIN 命令可以帮助你了解查询执行的详细信息，从而找出性能瓶颈并进行优化。以下是详细的步骤和方法，用于利用 EXPLAIN 进行SQL优化：

1. 运行 `EXPLAIN` 命令

首先，使用 EXPLAIN 命令来分析你的SQL查询。它会提供关于查询执行计划的详细信息。

EXPLAIN SELECT name, age FROM users WHERE age > 30 ORDER BY age;

2. 理解 `EXPLAIN` 输出

EXPLAIN 的输出通常包含以下几个关键字段，每个字段提供了有关查询执行的不同信息：

id: 查询的标识符，用于表示查询中各个部分的执行顺序。（id越大越先执行，同一id从上往下依次执行）
select_type: 表示查询的类型，如 SIMPLE（简单查询），PRIMARY（主查询），SUBQUERY（子查询），DERIVED(派生表)等。
table: 表示当前操作的表名。
type: 访问类型，表示查询访问表的方式。常见的类型包括 ALL（全表扫描）、index（索引扫描）、range（范围扫描）、ref（引用索引扫描）、eq_ref（等值索引扫描）、const（常数）。
1. ALL：全表扫描，效率最低。
2. index：全索引扫描，比全表扫描好，但仍可能影响性能。
3. range：范围扫描，适用于带有范围条件的查询。
4. ref：引用索引扫描，用于查找匹配的行。
5. eq_ref：等值引用，效率最高，用于一对一的匹配。
6. const：常数表扫描，表示表只有一个匹配的行。
possible_keys: 查询中可能使用的索引。
key: 实际使用的索引。
key_len: 使用的索引长度。
ref: 显示索引的哪些列或常量用于查找。
rows: 估算的需要扫描的行数。
Extra: 额外信息，如 Using where、Using index、Using temporary、Using filesort。

在这里插入图片描述

3. 分析 `EXPLAIN` 输出

对 EXPLAIN 输出进行详细分析，以找出潜在的性能问题：

3.1 检查访问类型

ALL: 表示全表扫描，通常意味着没有使用索引。尽量避免全表扫描，可以通过创建合适的索引来优化。
index: 表示索引扫描，全表索引扫描。这比全表扫描更快，但如果索引很大，仍可能影响性能。
range: 表示范围扫描，通常较好，尤其是对于带有范围条件的查询。
ref: 表示引用扫描，通常使用了索引，性能较好。
eq_ref: 表示等值引用，性能最佳。

3.2 检查实际使用的索引

possible_keys: 显示查询中可能使用的索引。确保查询使用了适当的索引。
key: 实际使用的索引。如果未使用预期的索引，考虑调整索引或优化查询语句。
key_len: 使用的索引长度，确认索引的选择是否足够细化。

3.3 检查行数估算

rows: 估算的扫描行数。大量的扫描行数通常表示查询效率低。通过优化查询条件和索引设计来减少扫描的行数。

3.4 检查额外信息

Extra: 包含额外的信息，如 Using where（使用了WHERE子句过滤）、Using index（查询只访问索引，不访问表数据）、Using temporary（使用临时表）、Using filesort（需要额外的排序操作）。

4. 优化方法

根据 EXPLAIN 输出的分析结果，采取相应的优化措施：

4.1 添加或调整索引

创建索引: 如果 EXPLAIN 显示全表扫描或没有使用索引，考虑为查询条件字段创建索引。
```
CREATE INDEX idx_age ON users (age);
```
复合索引: 对于多个查询条件，考虑创建复合索引。
```
CREATE INDEX idx_age_level ON users (age, level);
```

4.2 优化查询语句

避免使用 SELECT *: 只选择必要的列，减少数据传输量。
```
SELECT name, age FROM users WHERE age > 30;
```
重写查询: 尝试重写查询以提高性能，例如使用 JOIN 替代子查询。
使用合适的条件: 确保 WHERE 子句中的条件可以有效利用索引。