探索MySQL SELECT子查询：深入理解与优化技巧

九转成圣

已于 2024-06-01 15:26:36 修改

阅读量1.2k

点赞数 9

分类专栏：数据库文章标签： mysql 数据库

于 2024-05-16 17:23:37 首次发布

本文链接：https://blog.csdn.net/weixin_41883161/article/details/138969210

版权

数据库专栏收录该内容

7 篇文章 0 订阅

订阅专栏

在MySQL数据库中，SELECT子查询是一种强大的工具，可以在单个查询中实现复杂的数据检索和统计。然而，子查询的执行效率通常不如JOIN操作高，特别是在数据量大的情况下可能导致性能问题。本文详细解析了子查询的执行过程，包括主查询与子查询的依赖关系，以及如何通过LIMIT和ORDER BY优化子查询结果。此外，我们还探讨了子查询的实际应用场景，如统计部门人数和获取特定员工信息，并提供了用JOIN操作优化查询的方法。通过本文，读者将全面了解子查询的机制及其优化策略，为数据库性能提升提供实用的指导。

表结构

emp 表

+--------------+---------------+------+-----+-------------------+-----------------------------+
| Field        | Type          | Null | Key | Default           | Extra                       |
+--------------+---------------+------+-----+-------------------+-----------------------------+
| empno        | int(10)       | NO   | PRI | NULL              | auto_increment              |
| ename        | varchar(50)   | YES  | MUL | NULL              |                             |
| job          | varchar(100)  | YES  |     | NULL              |                             |
| mgr          | int(10)       | YES  | MUL | NULL              |                             |
| hiredate     | datetime      | YES  | MUL | NULL              |                             |
| sal          | decimal(10,2) | YES  | MUL | NULL              |                             |
| comm         | decimal(10,2) | YES  |     | NULL              |                             |
| deptno       | int(11)       | YES  |     | NULL              |                             |
| created_time | datetime      | YES  |     | CURRENT_TIMESTAMP |                             |
| updated_time | datetime      | YES  |     | NULL              | on update CURRENT_TIMESTAMP |
| is_deleted   | tinyint(1)    | YES  | MUL | 0                 |                             |
| version      | int(1)        | YES  |     | 1                 |                             |
+--------------+---------------+------+-----+-------------------+-----------------------------+

dept 表

+--------+-------------+------+-----+---------+----------------+
| Field  | Type        | Null | Key | Default | Extra          |
+--------+-------------+------+-----+---------+----------------+
| deptno | int(11)     | NO   | PRI | NULL    | auto_increment |
| dname  | varchar(10) | YES  |     | NULL    |                |
| loc    | varchar(50) | YES  |     | NULL    |                |
+--------+-------------+------+-----+---------+----------------+

数据示例

emp 表数据

mysql> select * from emp where empno =1;
+-------+--------+------+------+---------------------+------+-------+--------+
| empno | ename  | job  | mgr  | hiredate            | sal  | comm  | deptno |
+-------+--------+------+------+---------------------+------+-------+--------+
|     1 | 张无忌 | 教主 | NULL | 1981-11-17 00:00:00 | NULL | 20.00 |      4 |
+-------+--------+------+------+---------------------+------+-------+--------+
1 row in set (0.24 sec)

dept 表数据

mysql> select * from dept where deptno =4;
+--------+-------+------+
| deptno | dname | loc  |
+--------+-------+------+
|      4 | 运营  | 杭州 |
+--------+-------+------+
1 row in set (0.08 sec)

SELECT 子查询示例

查询员工编号为1的员工姓名和所在部门名称

mysql>  select ename, (select dname from dept d where e.deptno = d.deptno) as dname from emp e where empno = 1;
+--------+-------+
| ename  | dname |
+--------+-------+
| 张无忌 | 运营  |
+--------+-------+
1 row in set (0.07 sec)

执行计划

mysql> explain select ename, (select dname from dept d where e.deptno = d.deptno) as dname from emp e where empno = 1;
+----+--------------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------+
| id | select_type        | table | partitions | type  | possible_keys | key     | key_len | ref   | rows | filtered | Extra |
+----+--------------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------+
|  1 | PRIMARY            | e     | NULL       | const | PRIMARY       | PRIMARY | 4       | const |    1 |   100.00 | NULL  |
|  2 | DEPENDENT SUBQUERY | d     | NULL       | const | PRIMARY       | PRIMARY | 4       | const |    1 |   100.00 | NULL  |
+----+--------------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------+
2 rows in set (0.24 sec)

执行过程分析

通过执行计划可以看出，MySQL 先执行子查询（DEPENDENT SUBQUERY），再执行主查询。这部分的具体执行过程如下：

执行主查询的过滤条件：首先，从 emp 表中找到符合 empno = 1 条件的记录。
执行子查询：对于主查询的每一条记录，执行子查询。子查询的 e.deptno 是来自于主查询的 emp 表，因此子查询会根据当前主查询的记录来查询 dept 表中的 dname。
生成临时结果集：子查询的结果作为临时结果集与主查询的结果集结合，最终返回完整的查询结果。

需要注意的是，子查询是依赖于主查询的，意味着对于每一条主查询的记录，都会重新执行一次子查询。这在数据量较大的情况下，可能会导致性能问题。

子查询与 JOIN 的对比

使用子查询时，效率通常不如使用 JOIN 操作。这是因为子查询需要为每一条主查询记录执行一次，而 JOIN 可以一次性关联两个表，充分利用索引，提高查询效率。

子查询的执行顺序

在解释执行顺序时，明确子查询和主查询的依赖关系尤为重要。MySQL 会先执行主查询的过滤条件，然后在子查询中使用这些过滤条件的结果。子查询依赖于主查询的结果，只有在获取了主查询的结果之后，才能执行子查询。

子查询的限制与注意事项

子查询不能返回多行数据

如果子查询返回多行数据，会导致 SQL 错误。例如：

mysql> select d.dname, (select e.ename from emp e where e.deptno = d.deptno) from dept d where d.deptno = 3;
Subquery returns more than 1 row

使用 LIMIT 和 ORDER BY 控制子查询返回结果

可以使用 LIMIT 和 ORDER BY 控制子查询返回的结果，例如：

mysql> select d.dname, (select e.ename from emp e where e.deptno = d.deptno limit 1) from dept d where d.deptno = 3;
+-------+---------------------------------------------------------------+
| dname | (select e.ename from emp e where e.deptno = d.deptno limit 1) |
+-------+---------------------------------------------------------------+
| 市场  | 紫衫龙王                                                      |
+-------+---------------------------------------------------------------+
1 row in set (0.26 sec)

通过使用 ORDER BY 和 LIMIT 可以控制返回的具体记录，例如返回 empno 最大的员工：

mysql> select d.dname, (select e.ename from emp e where e.deptno = d.deptno order by e.empno desc limit 1) from dept d where d.deptno = 3;
+-------+-------------------------------------------------------------------------------------+
| dname | (select e.ename from emp e where e.deptno = d.deptno order by e.empno desc limit 1) |
+-------+-------------------------------------------------------------------------------------+
| 市场  | 青翼蝙王                                                                            |
+-------+-------------------------------------------------------------------------------------+
1 row in set (0.09 sec)

子查询可能的使用场景

带统计的查询

例如，查询部门名称、地点和部门人数：

mysql> select dname, loc, (select count(empno) from emp e where e.deptno = d.deptno) as count from dept d;
+-------+------+-------+
| dname | loc  | count |
+-------+------+-------+
| 开发  | 北京 |    10 |
| 测试  | 上海 |     3 |
| 市场  | 广州 |     4 |
| 运营  | 杭州 |     1 |
+-------+------+-------+
4 rows in set (0.09 sec)

查询部门中ID最大的一个员工的名称

mysql> select d.dname, (select e.ename from emp e where e.deptno = d.deptno order by e.empno desc limit 1) from dept d where d.deptno = 3;
+-------+-------------------------------------------------------------------------------------+
| dname | (select e.ename from emp e where e.deptno = d.deptno order by e.empno desc limit 1) |
+-------+-------------------------------------------------------------------------------------+
| 市场  | 青翼蝙王                                                                            |
+-------+-------------------------------------------------------------------------------------+
1 row in set (0.09 sec)

子查询优化建议

虽然子查询在某些场景下非常方便，但通常建议使用 JOIN 操作来代替子查询，因为 JOIN 可以更高效地利用索引，提高查询性能。例如，优化上述子查询的示例，可以使用 JOIN 实现：

mysql> select e.ename, d.dname 
       from emp e 
       join dept d on e.deptno = d.deptno 
       where e.empno = 1;
+--------+-------+
| ename  | dname |
+--------+-------+
| 张无忌 | 运营  |
+--------+-------+
1 row in set (0.01 sec)

通过 JOIN 操作，不仅查询性能更高，而且代码的可读性也更好，更容易维护。