SQL中的Subquery & CTE & Temporary Table 区别

Subquery、CTE 和 Temporary Table 的深度对比

这三个技术都用于创建临时数据集,但它们在实现方式、使用场景和性能特点上有显著差异。让我们用"数学演草纸"的比喻来深入分析:

1. 子查询 (Subquery)

比喻:就像在解题过程中随手在题目旁边写的草稿计算

特点

  • 内联性:直接嵌套在SQL语句中(SELECT/FROM/WHERE等子句内)
  • 一次性使用:定义后只能在该处使用一次
  • 无命名:通常没有显式的名称(除非是派生表)
  • 作用域:仅在包含它的查询中有效

示例

SELECT user_id 
FROM orders 
WHERE amount > (SELECT AVG(amount) FROM orders);  -- WHERE子句中的子查询

适用场景

  • 简单的单次使用计算
  • 作为过滤条件或比较值
  • 快速测试不需要复用的逻辑

2. 公共表表达式 (CTE, Common Table Expression)

比喻专门拿出一张草稿纸写中间步骤,可以随时翻看

特点

  • 显式命名:使用WITH cte_name AS语法定义
  • 可复用性:在同一个WITH子句中可定义多个CTE,且后面的CTE可以引用前面的
  • 查询级作用域:仅在紧随其后的单个SQL语句中有效
  • 可递归:支持递归查询(处理层次结构数据)

示例

-- 使用CTE和比较运算符 >,先筛选出消费总额超过1000的高价值用户和最近30天活跃用户,最终通过 INTERSECT 取两者的交集,找出​​既高消费又活跃的核心用户群体​​。
WITH high_value_customers AS (
    SELECT user_id FROM orders GROUP BY user_id HAVING SUM(amount) > 1000
), #筛选订单总额超过1000的用户
active_customers AS (
    SELECT user_id FROM logins WHERE login_date > CURRENT_DATE - 30
) #筛选30天内有登录记录的活跃用户
SELECT * FROM high_value_customers 
INTERSECT 
SELECT * FROM active_customers;

适用场景

  • 复杂查询的模块化设计
  • 需要多次引用同一结果集
  • 递归查询
  • 提高复杂查询的可读性

3. 临时表 (Temporary Table)

比喻:专门准备一个笔记本记录中间结果,可以反复翻阅和修改

特点

  • 物理存储:实际存储在tempdb中(内存或磁盘)
  • 会话级作用域:创建后在整个会话期间可用,直到显式删除或会话结束
  • 可索引:可以添加索引优化性能
  • 可修改:支持INSERT/UPDATE/DELETE操作
  • 跨查询使用:可以被同一会话的多个查询使用

示例

CREATE TEMPORARY TABLE temp_high_value AS
SELECT user_id FROM orders GROUP BY user_id HAVING SUM(amount) > 1000;

ALTER TABLE temp_high_value ADD INDEX (user_id);  -- 可以添加索引

SELECT * FROM temp_high_value h JOIN users u ON h.user_id = u.id;

DROP TEMPORARY TABLE IF EXISTS temp_high_value;  -- 显式清理

适用场景

  • 复杂的ETL流程
  • 需要多次重用的中间结果
  • 大型数据集处理(特别是需要索引优化时)
  • 跨多个SQL语句共享数据

三者的核心对比

特性子查询 (Subquery)CTE临时表 (Temporary Table)
存储方式逻辑存在,不物理存储逻辑存在,可能被优化器物化物理存储在tempdb
作用域当前子句当前语句整个会话
生命周期查询执行期间查询执行期间显式删除或会话结束
是否可复用不可复用同一WITH子句内可引用跨查询复用
是否可修改不可修改不可修改可INSERT/UPDATE/DELETE
是否支持索引不支持不支持支持
性能特点简单查询高效中等复杂度查询最优复杂数据处理最优
语法复杂度简单中等较高
典型使用场景简单过滤/计算复杂查询模块化跨语句共享数据/大型处理

如何选择?

  1. 简单计算 → 子查询
  2. 中等复杂度查询 → CTE(提高可读性)
  3. 需要多次引用/修改 → 临时表
  4. 递归查询 → CTE WITH RECURSIVE
  5. 会话级重用 → 临时表

记住:随着SQL复杂度的增加,通常的开发路径是:子查询 → CTE → 临时表。优化器对三者的处理方式不同,在性能关键场景中需要测试验证。

SQL中,子查询(Subquery)指的是一个查询嵌套在另一个查询中,作为一个表达式使用。它通常出现在SELECT、FROM、WHERE、HAVING或INSERT语句中的一个子句中。子查询可以用来过滤数据、计算聚合值、进行比较等。 以下是一些常见的子查询用法: 1. WHERE子句中的子查询: ``` SELECT column1, column2 FROM table1 WHERE column1 IN (SELECT column1 FROM table2 WHERE column2 = 'value'); ``` 这个子查询将返回table2表中column2等于'value'的所有行中的column1列,然后将这些值与table1表中的column1列进行比较,返回符合条件的行。 2. FROM子句中的子查询: ``` SELECT column1, column2, subquery_value FROM table1, (SELECT column1, COUNT(*) AS subquery_value FROM table2 GROUP BY column1) sub WHERE table1.column1 = sub.column1; ``` 这个子查询将在FROM子句中嵌套一个子查询,用来计算table2表中每个column1值出现的次数,然后将结果作为一个虚拟表(即sub)与table1表进行连接,并返回计算结果。 3. EXISTS子查询: ``` SELECT column1, column2 FROM table1 WHERE EXISTS (SELECT * FROM table2 WHERE table2.column1 = table1.column1); ``` 这个子查询将返回table2表中与table1表中column1列匹配的所有行,如果存在这样的行,则返回table1表中的column1和column2列。 需要注意的是,子查询的性能可能会比较低,因为它需要进行多次查询和嵌套。在使用子查询时,应该尽量减少查询的嵌套层数和查询的数据量,以提高查询性能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值