子查询与连表查询

九转成圣

已于 2024-05-18 14:16:40 修改

阅读量1.5k

点赞数 10

分类专栏：数据库文章标签：数据库 java sql

于 2024-03-08 08:00:17 首次发布

本文链接：https://blog.csdn.net/weixin_41883161/article/details/136507482

版权

数据库专栏收录该内容

7 篇文章 0 订阅

订阅专栏

在数据库操作中，子查询和连表查询是两种常见的查询方式。理解这两种查询方式的原理和性能差异，对于优化数据库查询性能至关重要。本文将详细探讨子查询与连表查询的概念、语法、执行计划，并结合实际案例进行分析，帮助读者更好地理解如何在实际应用中选择和优化查询方式。

子查询与连表查询概述

子查询

子查询（Subquery）是嵌套在其他查询语句中的查询。它可以位于 SELECT、FROM、WHERE、HAVING 等子句中，主要用于根据一个查询的结果进行进一步的查询。子查询通常分为以下几种类型：

标量子查询：返回单个值的子查询。
列子查询：返回一列值的子查询。
行子查询：返回一行值的子查询。
表子查询：返回一个结果集的子查询。

连表查询

连表查询（Join Query）是通过在两个或多个表之间建立关联来进行数据查询。常见的连表类型包括：

内连接（INNER JOIN）：只返回两个表中匹配的行。
左连接（LEFT JOIN 或 LEFT OUTER JOIN）：返回左表中的所有行，以及右表中与之匹配的行。
右连接（RIGHT JOIN 或 RIGHT OUTER JOIN）：返回右表中的所有行，以及左表中与之匹配的行。
全连接（FULL JOIN 或 FULL OUTER JOIN）：返回两个表中的所有行，当其中一张表没有匹配行时，结果为 NULL。

子查询与连表查询的语法和执行计划

子查询语法与执行计划

以下是一个使用子查询的示例：

EXPLAIN SELECT e.empno, e.ename, (SELECT dname FROM dept d WHERE e.deptno = d.deptno) AS dname
FROM emp e
WHERE e.deptno = 1;

执行计划：

id	select_type	table	partitions	type	possible_keys	key	key_len	ref	rows	filtered	Extra
1	PRIMARY	e	NULL	ALL	NULL	NULL	NULL	NULL	47	10.00	Using where
2	DEPENDENT SUBQUERY	d	NULL	eq_ref	PRIMARY	PRIMARY	4	scott.e.deptno	1	100.00	NULL

在这个查询中，子查询 (SELECT dname FROM dept d WHERE e.deptno = d.deptno) 对每一行都进行一次，导致 dept 表被扫描多次。

连表查询语法与执行计划

以下是一个使用连表查询的示例：

EXPLAIN SELECT e.empno, e.ename, d.dname
FROM emp e
JOIN dept d ON e.deptno = d.deptno
WHERE e.deptno = 1;

执行计划：

id	select_type	table	partitions	type	possible_keys	key	key_len	ref	rows	filtered	Extra
1	SIMPLE	d	NULL	const	PRIMARY	PRIMARY	4	const	1	100.00	NULL
1	SIMPLE	e	NULL	ALL	NULL	NULL	NULL	NULL	47	10.00	Using where

在这个查询中，dept 表仅扫描一次，而 emp 表扫描一次。这表明连表查询通常效率更高，因为它减少了对表的扫描次数。

详细案例分析

子查询案例分析

我们来看一个更加复杂的子查询示例：

EXPLAIN SELECT e.empno, e.ename, 
    (SELECT d.dname FROM dept d WHERE e.deptno = d.deptno) AS dname
FROM emp e
WHERE e.job = '五散人';

执行计划：

id	select_type	table	partitions	type	possible_keys	key	key_len	ref	rows	filtered	Extra
1	PRIMARY	e	NULL	ALL	NULL	NULL	NULL	NULL	47	10.00	Using where
2	DEPENDENT SUBQUERY	d	NULL	eq_ref	PRIMARY	PRIMARY	4	scott.e.deptno	1	100.00	NULL

在这个查询中，由于 WHERE 子句过滤了 emp 表中的行，只有满足条件 e.job = '五散人' 的行才会进行子查询。尽管如此，子查询 (SELECT d.dname FROM dept d WHERE e.deptno = d.deptno) 仍会对每一行执行一次，对 dept 表进行多次扫描。

连表查询案例分析

相同的查询条件下，使用连表查询：

EXPLAIN SELECT e.empno, e.ename, d.dname
FROM emp e
JOIN dept d ON e.deptno = d.deptno
WHERE e.job = '五散人';

执行计划：

id	select_type	table	partitions	type	possible_keys	key	key_len	ref	rows	filtered	Extra
1	SIMPLE	d	NULL	ALL	PRIMARY	NULL	NULL	NULL	4	100.00	NULL
1	SIMPLE	e	NULL	ALL	NULL	NULL	NULL	NULL	47	2.13	Using where; Using join buffer (Block Nested Loop)

在这种情况下，连表查询依然表现更好，因为它避免了对 dept 表的多次扫描。

性能优化策略

子查询优化策略

避免嵌套子查询：尽量避免在查询中嵌套多个子查询，特别是涉及大表时。可以尝试使用 JOIN 或者将子查询结果缓存到临时表中。
使用索引：确保子查询中的条件列上有索引，以提高查询效率。
减少返回的数据量：通过增加过滤条件或者使用聚合函数来减少子查询返回的数据量。

连表查询优化策略

选择合适的连接类型：根据具体需求选择合适的连接类型（如 INNER JOIN、LEFT JOIN 等），避免不必要的全表扫描。
使用索引：确保连接条件列上有索引，这可以大幅度提高连接操作的性能。
减少数据量：在 WHERE 子句中尽量使用过滤条件，减少参与连接的数据量。
优化查询计划：通过分析 EXPLAIN 输出的执行计划，了解查询执行的具体步骤，并进行针对性的优化。

实际案例中的选择

在实际应用中，选择子查询还是连表查询，通常取决于具体的场景和需求。以下是一些指导原则：

小规模数据集：在小规模数据集上，子查询和连表查询的性能差异可能不明显，可以根据代码可读性和维护性来选择。
大规模数据集：在大规模数据集上，连表查询通常性能更好，尤其是在需要对多个表进行关联查询时。
复杂查询需求：对于复杂的查询需求，连表查询通常更灵活，可以通过适当的索引和优化策略提高查询性能。
特定需求：如果查询需求非常特殊（如需要在子查询中进行复杂的计算或过滤），子查询可能更适合。

结论

通过以上分析，我们可以得出结论：在大多数情况下，连表查询的效率通常比子查询高，因为它减少了对表的扫描次数。然而，在特定场景下，子查询也有其独特的优势。因此，在实际应用中，需要根据具体需求和数据规模，灵活选择合适的查询方式，并结合索引、执行计划分析等优化手段，确保查询的高效执行。

本文通过详细的案例分析和执行计划比较，展示了子查询与连表查询的优劣，希望能够帮助读者更好地理解和应用这两种查询方式，为数据库性能优化提供有价值的参考。

九转成圣

关注

10
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
子查询与连表查询

可以看出连表查询被优化器优化成了dept表关联empt表。子查询需要多次扫子表,总共扫1+n。一般认为连表查询效率比子查询高。连表查询两个表各扫一次。
复制链接

扫一扫

专栏目录