hive中使用with as优化SQL语句

前言

hive可以通过with查询来提高查询性能,因为先通过with语法将数据查询到内存(既然是加到内存中,如果数据量太大,估计会占用大量资源,可能会报内存溢出),然后后面其它查询可以直接使用,这种方法与创建临时表类似但是不需要创建临时表实体表,内存中的子查询结果在会话结束后会自动删除。使用with as可提高代码可读性。

公用表表达式(CTE)是从WITH子句中指定的简单查询派生的临时结果集(会把查询的表数据放到内存中,供其他查询随时使用),该子句紧跟在SELECT或INSERT关键字之前。CTE仅在单个语句的执行范围内定义。可以在Hive SELECT,INSERT, CREATE TABLE AS SELECT或CREATE VIEW AS SELECT语句中使用一个或多个CTE 。

使用HIVE-1180在Hive 0.13.0中添加了通用表格表达式。

语法

withClause: cteClause (, cteClause)*
cteClause: cte_name AS (select statment)

注意

SubQuery Blocks中不支持WITH子句
Views,CTAS和INSERT语句支持CTE。
不支持递归查询。

举例

在 select 中使用 CTE

with q1 as ( select key from src where key = '5')
select *
from q1;
 
-- from style
with q1 as (select * from src where key= '5')
from q1
select *;
  
-- chaining CTEs
with q1 as ( select key from q2 where key = '5'),
q2 as ( select key from src where key = '5')
select * from (select key from q1) a;

with q1 as ( select key from src where key = '5'),
q2 as ( select key from q1 where key = '5')
select * from (select key from q2) a;

-- union example
with q1 as (select * from src where key= '5'),
q2 as (select * from src s2 where key = '4')
select * from q1 union all select * from q2;

chaining CTEs 两个举例执行结果一样

CTE in Views, CTAS, and Insert Statements

-- insert example
create table s1 like src;
with q1 as ( select key, value from src where key = '5')
from q1
insert overwrite table s1
select *;
 
-- ctas example
create table s2 as
with q1 as ( select key from src where key = '4')
select * from q1;
 
-- view example
create view v1 as
with q1 as ( select key from src where key = '5')
select * from q1;
select * from v1;
  
-- view example, name collision
create view v1 as
with q1 as ( select key from src where key = '5')
select * from q1;
with q1 as ( select key from src where key = '4')
select * from v1;

在第二个View示例中,查询的CTE与创建视图时使用的CTE不同。结果将包含key ='5’的行,因为在视图的查询语句中,视图定义中定义的CTE生效。

with的相关总结

使用with子句可以让子查询重用相同的with查询块,通过select调用(with子句只能被select查询块引用),一般在with查询用到多次情况下。

with子句的返回结果存到用户的临时表空间中,只做一次查询,反复使用,提高效率。

在同级select前有多个查询定义的时候,第1个用with,后面的不用with,并且用逗号隔开。

最后一个with 子句与下面的查询之间不能有逗号,只通过右括号分割,with 子句的查询必须用括号括起来。

如果定义了with子句,而在查询中不使用,那么会报ora-32035 错误:未引用在with子句中定义的查询名。(至少一个with查询的name未被引用,解决方法是移除未被引用的with查询),注意:只要后面有引用的就可以,不一定非要在主查询中引用,比如后面的with查询也引用了,也是可以的。

前面的with子句定义的查询在后面的with子句中可以使用。但是一个with子句内部不能嵌套with子句。

当一个查询块名字和一个表名或其他的对象相同时,解析器从内向外搜索,优先使用子查询块名字。

with查询的结果列有别名,引用的时候必须使用别名或*。

官网地址:https://cwiki.apache.org/confluence/display/Hive/Common+Table+Expression#app-switcher

  • 2
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在HiveSQL,WITH AS是一种常见的子查询语法,用于在查询定义临时表并将其命名。这样可以在后续的查询使用这个临时表,从而简化查询语句的编写和理解。 具体来说,WITH AS语法的格式如下: WITH temp_table_name AS ( SELECT ... FROM ... WHERE ... ) SELECT ... FROM ... JOIN temp_table_name ON ... 其,temp_table_name是临时表的名称,可以自定义。SELECT语句用于定义临时表的内容,可以包含任意的查询语句,例如聚合函数、子查询等。后续的查询语句可以使用JOIN等操作来引用这个临时表。 使用WITH AS语法可以提高查询的可读性和可维护性,尤其是在复杂的查询场景下。但需要注意的是,临时表只在当前查询有效,不会被保存到数据库。 ### 回答2: HiveQL的WITH AS是一种非常方便的SQL语言结构,可以通过它来创建临时表,并将其作为子查询使用。与传统的子查询不同,使用WITH AS可以让复杂的查询变得更加简单、清晰易懂。它的语法结构如下: WITH subquery_name AS (subquery) SELECT ... 其,subquery_name是子查询的名称,subquery是子查询的主体部分,可以是包含多个SQL语句的复杂查询;而在SELECT语句,则可以使用子查询名称来引用这个子查询。 值得注意的是,WITH AS所创建的临时表只在当前查询有效,并且在当前查询执行之后会被删除。 下面我们通过一个示例来详细说明WITH AS的使用方法。假设我们有如下的数据表dt_table: +-----+-----+-----+-----+ | id | t1 | t2 | t3 | +-----+-----+-----+-----+ | 001 | A | C | D | | 002 | B | D | E | | 003 | C | E | F | +-----+-----+-----+-----+ 如果我们要查询表dt_table每个id对应的t1、t2和t3,并且将这些列合并起来(即将它们串联成一个新的字符串),以便于后续分析,我们可以使用WITH AS来实现: WITH dt_table_concat AS ( SELECT id, CONCAT_WS(",", t1, t2, t3) AS t_concat FROM dt_table ) SELECT dt_table_concat.id, dt_table_concat.t_concat FROM dt_table_concat; 在上面的代码,我们使用了CONCAT_WS函数来将多列字段串联在一起,并通过WITH AS返回一个名为dt_table_concat的临时表。而在SELECT语句,则是通过这个临时表来获取我们需要的结果。通过这种方式,我们能够更加方便快捷地实现一些需要使用到子查询的复杂查询,提高查询效率和代码的可读性。 ### 回答3: hivesqlwith as的用法是在Hive查询声明一个临时表格,对于复杂的查询语句非常有用。with as关键字后面的内容是一个查询语句,它定义了一个临时表格,这个表格在后面的查询可以引用,实际上是为这个子查询定义别名。 使用with as时,可以提高代码的可读性和可维护性。因为with as关键字可以将复杂的查询拆分成比较简单的子查询,并且有助于减少重复的代码。同时,with as也可以优化查询性能,因为临时表格只需要计算一次,而不是在每个查询都重新计算一遍。 with as的语法格式如下: with [别名] as (子查询) 其,[别名]是可选项,如果省略,则别名默认为子查询第一个列名。子查询的结果集就是临时表格的记录。 下面是一个使用with as的例子: with employee_dept as ( select employee.name as emp_name, department.name as dept_name from employee join department on employee.dept_id = department.id ) select dept_name, count(*) as emp_count from employee_dept group by dept_name; 在此示例使用with as关键字先定义了一个临时表格employee_dept,用于存储employee和department表连接后的数据。然后,该临时表格再被引用,按部门名称进行汇总统计。此时,使用了临时表格之后,查询代码的可读性和可维护性都得到了提高。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值