概述
WITH AS短语,也叫做子查询部分(subquery factoring),是用来定义一个SQL片断,该SQL片断会被整个SQL语句所用到。这个语句,即为公用表表达式(CTE,Common Table Expression),比如with A as (select * from class) select * from A
,先执行select * from class
得到一个结果,记录为A,再执行select * from A
语句。A表只是一个别名。对于大批量的SQL数据,可起到优化作用。
查询
更新
总结
- 使用with子句可以让子查询重用相同的with查询块,通过select调用(with子句只能被select查询块引用),一般在with查询用到多次情况下。在引用的select语句之前定义,同级只能定义with关键字只能使用一次,逗号分割
- with子句的返回结果存到用户的临时表空间中,只做一次查询,反复使用,提高效率
- 在同级select前有多个查询定义时,第1个用with,后面的不用with,逗号隔开
- 最后一个with子句与下面的查询之间不能有逗号,只通过右括号分割,with子句的查询必须用括号括起来
- 如果定义with子句,而在查询中不使用,会报
ora-32035
错误:未引用在with子句中定义的查询名。(至少一个with查询的name未被引用,解决方法是移除未被引用的with查询),只要后面有引用的就可以,不一定非要在主查询中引用,后面的with查询引用也可以 - 前面的with子句定义的查询在后面的with子句中可以使用。但是一个with子句内部不能嵌套with子句
- 当一个查询块名字和一个表名或其他的对象相同时,解析器从内向外搜索,优先使用子查询块名字
- with查询的结果列有别名,引用时必须使用别名或
*
- 相当于一个临时表,但是不同于视图,不会存储起来
扩展
不同的SQL dialect,对WITH AS的支持不一样。
MySQL
MySQL 8版本才开始提供对WITH AS的语法支持。在MySQL 8.0版本之前,需要使用子查询或临时表来实现类似的功能。
Hive
Hive因为有很多个版本和发行商而比较复杂。以版本为例:
- Hive 0.13.0及以上版本:开始支持WITH子句,可以用于定义临时表达式。部分版本开始支持WITH AS子句,允许使用WITH定义的表达式中使用AS定义临时表。在某些情况下,需要启用Hive的特定配置才能完全支持WITH AS查询。
- Hive 2.1.0及以上版本:对WITH AS的支持更加完善,通常无需额外配置即可使用
另外,需要留意所使用的 Hadoop 发行版对于 Hive 的版本支持情况,因为有些发行版可能会有自己的版本兼容性要求和配置。
比如支持如下嵌套with as
查询:
with temp2 as (
with temp1 as (
select * from xxx
)
select * from temp1
)
select * from temp2;
clickhouse
参考clickhouse-with-as,CK提供WITH关键字来支持CTE,WITH结果子句可以在其余部分中使用SELECT查询。
CK with as
的限制:
- 不支持递归查询
- 当在section中使用子查询时,它的结果应该是只有一行的标量
- Expression的结果在子查询中不可用
例子
- 使用常量表达式作为variable
WITH '2019-08-01 15:23:00' as ts_upper_bound
SELECT * FROM hits WHERE EventDate = toDate(ts_upper_bound) AND EventTime <= ts_upper_bound
- 从SELECT子句列表中逐出sum(bytes)表达式结果
WITH sum(bytes) as s
SELECT formatReadableSize(s), table
FROM system.parts GROUP BY table ORDER BY s
- 使用标量子查询的结果
/* this example would return TOP 10 of most huge tables */
WITH
(
SELECT sum(bytes)
FROM system.parts
WHERE active
) AS total_disk_usage
SELECT (sum(bytes) / total_disk_usage) * 100 AS table_disk_usage, table
FROM system.parts GROUP BY table ORDER BY table_disk_usage DESC LIMIT 10;
- 在子查询中重用表达式
作为子查询中表达式使用的当前限制的解决方法,
WITH ['hello'] AS hello
SELECT hello, * FROM
(
WITH ['hello'] AS hello
SELECT hello
)
PostgreSQL
PostgreSQL对with as
的支持也很完备,如支持多个with子句。实例:
with
u1 as (select id, sum(amount) as num from pay where pay_time >= 1493568000 and pay_time < 1494172800 group by id),
u2 as(select id, sum(amount) as total from pay where pay_time < 1494172800 group by id)
select u1.id, pinfo.sid, u1.num, u2.total from u1, u2, pinfo
where u2.id = u1.id and pinfo.id = u1.id;
使用with查询出固定时间内充值的玩家id和期间充值总数,使用with查询出指定时间之前充值的玩家的id和历史充值总数,再查询出u1中所有id对应的u2中的数据,以及pinfo中的sid。
可以在WITH中使用数据修改语句(INSERT、UPDATE或DELETE),允许你在同一个查询中执行多个操作:
WITH moved_rows AS (
DELETE FROM products
WHERE
"date" >= '2022-06-01' AND
"date" < '2022-06-10'
RETURNING *
)
INSERT INTO products_log
SELECT * FROM moved_rows;