hive统计分析窗口函数实战

本文详细介绍了Hive窗口函数的使用,包括Rank、DENSE_RANK、ROW_NUMBER、NTILE、累计和、移动平均值、LAG和LEAD等功能,并通过实例展示了如何在数据分析中运用这些函数解决实际问题。
摘要由CSDN通过智能技术生成

窗口函数应用场景:

(1)用于分区排序

(2)动态Group By

(3)Top N

(4)累计计算

(5)层次查询

 

一、分析函数

用于等级、百分点、n分片等。

函数 说明
RANK() 返回数据项在分组中的排名,排名相等会在名次中留下空位
DENSE_RANK() 返回数据项在分组中的排名,排名相等会在名次中不会留下空位
NTILE() 返回n分片后的值
ROW_NUMBER() 为每条记录返回一个数字

 

  • Rank、DENSE_RANK

RANK()在出现等级相同的元素时预留为空,DENSE_RANK()不会。

Eg:某产品类型有两个并列第一

RANK():第一二为1,第三位3

DENSE_RANK():第一二为1,第三位2

Sql代码   收藏代码
  1. SELECT  
  2. column_name,  
  3. RANK() OVER (ORDER BY column_name DESC) AS rank,  
  4. DENSE_RANK() OVER (ORDER BY SUM(column_name) DESC) AS dense_rank  
  5. FROM table_name  

OVER 需要,括号内为编号顺序

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值