Hive:聚合运算

一、GRPUP BY

作用:用于分组
注意事项:

  1. Hive基本内置聚合函数与GROUP BY 一起使用
  2. 如果没有指定GROUP BY 字句,则默认聚合整个表
  3. 除聚合函数外,所选的其他列也必须包含在group by 中
  4. GROUP BY支持使用CASE WHEN或表达式

示例
以表中城市分组

select city ,count(1) from emp_psn group by city;

以城市分组对phone列进行统计查询城市,注意的是group by后面要把列写全。多不行,漏也不行。

select emp_id,city,coount(phone) from emp_psn group by city,emp_id;

二、HAVING

作用:对 group by聚合结果的条件过滤
注意事项;

  1. 可以避免在GROUP BY之后使用子查询
  2. HAVING之后可以使用表达式,但不建议使用

示例
以age分组查询age<=1的

-- having使用
select sex_age.age from employee group by sex_age.age having count(*) <= 1;
-- 使用子查询代替having
select a.age from ( select count(*) as cnt, sex_age.age 
from employee group by sex_age.age ) a where a.cnt <= 1;

三、基础聚合

基础聚合函数
max, min, count, sum, avg
max(distinct col1)、avg(col2)等
collect_set, collect_list:返回每个组列中的对象集/列表
注意事项

  1. 一般与GROUP BY一起使用
  2. 可应用于列或表达式
  3. 对NULL的count聚合为0
  4. select count(null) = 0
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值