大数据Hive之group by、count、over

40 篇文章 20 订阅
17 篇文章 1 订阅

group by和count在Hive与mysql用法基本一致,

今天说一下group by、count组合用法在hive中的需要注意的地方,以及实现一个功能的sql写法

 

目标:统计表中id和总条数

模型:tab(id string)

输出:id、count(*)

 

需求1:输出表中总记录数

select count(*) from tab;

需求2:输出表中id,总条数

select id,count(*) from tab;

 

这样计算就会报错

 

解决方式两种

方式一(开窗):

select id,count(*)over() from tab group by id;

 

方式二(join):

select * from 
(select id from tab)a 
left join 
(select count(*) total from tab) b
group by a.id,b.total;

对比:

1、都需要去重

2、方式一语法简洁

3、方式一执行时间短

 

 

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
是的,count over partition by 可以去重。在SQL中,使用count函数结合over和partition by子句可以实现对分组后的数据进行去重计数。具体实现方式是将count(distinct ) over(partition by order by)替换成size(collect_set() over(partition by order by))。这样可以求得分组后的去重个数。这种方法适用于既要保证原数据明细表不变,又要保证分组统计数据的场景。另外,还可以使用distinct关键字结合count函数来实现去重计数,例如select distinct name,count(*) over () from t_window where substring(orderdate,1,7) = '2015-04'。还可以使用group by子句来实现去重计数,例如select name,count(*) over () from t_window where substring(orderdate,1,7) = '2015-04' group by name。 #### 引用[.reference_title] - *1* [【hive&spark】HiveSql&SparkSql—COUNT(DISTINCT ) OVER (PARTITION BY )报错解决方案](https://blog.csdn.net/qyj19920704/article/details/126372968)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [Hive窗口函数Over partition by](https://blog.csdn.net/weixin_32265569/article/details/115475759)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

罗少说

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值