hive 语句中with子查询的用法

with...as...也叫做子查询部分,语句允许hive定义一个sql片段,供整个sql使用

简介

with...as...需要定义一个sql片段,会将这个片段产生的结果集保存在内存中,
后续的sql均可以访问这个结果集和,作用与视图或临时表类似.

语法限制

  1. with...as...必须和其他sql一起使用(可以定义一个with但在后续语句中不使用他)
  2. with...as...是一次性的

with...as...的完整格式是这样的

 

-- with table_name as(子查询语句) 其他sql 
with temp as (
    select * from xxx
)
select * from temp;

只定义不实用

 

with temp as (
    select * from xxx
)
select * from othertable;

同级的多个temp之间用,分割with只需要一次,as后的子句必须用(),

 

with temp1 as (
    select * from xxx
),temp2 as (
    select * from xxx
)
select * from temp1,temp2;

with...as...当然是可以嵌套的,此处举一个简单例子

 

with temp2 as (
    with temp1 as (
        select * from xxx
    )
    select * from temp1
)
select * from temp2;

with...as...只能在一条sql中使用

 

with temp1 as (
    select * from xxx
)
select * from temp1;
select xxx from temp1; -- error! no table named temp1;

语句的优点

  1. 提高代码可读性(结构清晰)
  2. 简化sql,优化执行速度(with子句只需要执行一次)

栗子

现有 city 表,结构如下:

city_numbercity_nameprovince
010北京北京
021上海上海
025南京江苏
0512昆山江苏
0531济南山东
0533淄博山东

然后分别有商品表good

city_numbergood_name
010A
021B

现在需要分别统计这上海商品,一般sql如下:

 

select * from `good`  where city_number in (select city_number from city where city_name = "上海");

除了子查询,上述的的例子还可以用join来实现,

如果用with...as...语句实现,如下

 

with tmp_shanghai as(
    select city_number from city where city_name = "上海"
)
select * from `good` where tmp_shanghai in (select * from tmp_shanghai) 

看起来使用 with...as... 语句反而更复杂一点,但如果tmp_shanghai要被多次使用的使用,就很有必要

来看一个实际的例子,有一张操作表event主要字段如下:

dateevent_key
20190530Delete
20190530Put
20190530Get
20190530Get
20190601Set

......

现在要求一条sql统计出GetSet 操作的数量,先使用子查询实现

 

select (
    select count(*) from event where event_key = "Get"
) as get_num,(
    select count(*) from event where event_key = "Set"
) as set_num

如果再增加其他项的统计呢,是否每一个均需要增加一个对event表进行扫描的自查询

使用 with...as...

 

with temp as(
    select * from event where event_key = "Get" or event_key = "Set"
)
select 
    sum(case when event_key = "Get" then 1 else 0 end) as get_num,
    sum(case when event_key = "Set" then 1 else 0 end) as Set_num
from temp

阅读性是否比之前有所提高?此外,这条语句只对event表进行了一次扫描,将符合条件的数据存入temp中供后续计算,
在event表数据集非常大的情况下,性能将比子查询的方式优秀很多


 

### 回答1: 在HiveSQL,WITH AS是一种常见的子查询语法,用于在查询定义临时表并将其命名。这样可以在后续的查询使用这个临时表,从而简化查询语句的编写和理解。 具体来说,WITH AS语法的格式如下: WITH temp_table_name AS ( SELECT ... FROM ... WHERE ... ) SELECT ... FROM ... JOIN temp_table_name ON ... 其,temp_table_name是临时表的名称,可以自定义。SELECT语句用于定义临时表的内容,可以包含任意的查询语句,例如聚合函数、子查询等。后续的查询语句可以使用JOIN等操作来引用这个临时表。 使用WITH AS语法可以提高查询的可读性和可维护性,尤其是在复杂的查询场景下。但需要注意的是,临时表只在当前查询有效,不会被保存到数据库。 ### 回答2: HiveQL的WITH AS是一种非常方便的SQL语言结构,可以通过它来创建临时表,并将其作为子查询使用。与传统的子查询不同,使用WITH AS可以让复杂的查询变得更加简单、清晰易懂。它的语法结构如下: WITH subquery_name AS (subquery) SELECT ... 其,subquery_name是子查询的名称,subquery是子查询的主体部分,可以是包含多个SQL语句的复杂查询;而在SELECT语句,则可以使用子查询名称来引用这个子查询。 值得注意的是,WITH AS所创建的临时表只在当前查询有效,并且在当前查询执行之后会被删除。 下面我们通过一个示例来详细说明WITH AS的使用方法。假设我们有如下的数据表dt_table: +-----+-----+-----+-----+ | id | t1 | t2 | t3 | +-----+-----+-----+-----+ | 001 | A | C | D | | 002 | B | D | E | | 003 | C | E | F | +-----+-----+-----+-----+ 如果我们要查询表dt_table每个id对应的t1、t2和t3,并且将这些列合并起来(即将它们串联成一个新的字符串),以便于后续分析,我们可以使用WITH AS来实现: WITH dt_table_concat AS ( SELECT id, CONCAT_WS(",", t1, t2, t3) AS t_concat FROM dt_table ) SELECT dt_table_concat.id, dt_table_concat.t_concat FROM dt_table_concat; 在上面的代码,我们使用了CONCAT_WS函数来将多列字段串联在一起,并通过WITH AS返回一个名为dt_table_concat的临时表。而在SELECT语句,则是通过这个临时表来获取我们需要的结果。通过这种方式,我们能够更加方便快捷地实现一些需要使用到子查询的复杂查询,提高查询效率和代码的可读性。 ### 回答3: hivesqlwith as的用法是在Hive查询声明一个临时表格,对于复杂的查询语句非常有用。with as关键字后面的内容是一个查询语句,它定义了一个临时表格,这个表格在后面的查询可以引用,实际上是为这个子查询定义别名。 使用with as时,可以提高代码的可读性和可维护性。因为with as关键字可以将复杂的查询拆分成比较简单的子查询,并且有助于减少重复的代码。同时,with as也可以优化查询性能,因为临时表格只需要计算一次,而不是在每个查询都重新计算一遍。 with as的语法格式如下: with [别名] as (子查询) 其,[别名]是可选项,如果省略,则别名默认为子查询第一个列名。子查询的结果集就是临时表格的记录。 下面是一个使用with as的例子: with employee_dept as ( select employee.name as emp_name, department.name as dept_name from employee join department on employee.dept_id = department.id ) select dept_name, count(*) as emp_count from employee_dept group by dept_name; 在此示例,使用with as关键字先定义了一个临时表格employee_dept,用于存储employee和department表连接后的数据。然后,该临时表格再被引用,按部门名称进行汇总统计。此时,使用了临时表格之后,查询代码的可读性和可维护性都得到了提高。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值