hive开窗函数总结

1,sum()函数

select cookieid,createtime,pv,

sum(pv) over(PARTITION BY cookieid ORDER BY createtime) as pv1

FROM test1;

è¿éåå¾çæè¿°

select cookieid,createtime,pv,

sum(pv) over(PARTITION BY cookieid) as pv1

FROM test1;

è¿éåå¾çæè¿°

 注:没有order by,不仅分区内没有排序,sum()计算的pv也是整个分区的pv。

        max()函数无论有没有order by 都是计算整个分区的最大值

2,NTILE 函数

NTILE(n),用于将分组数据按照顺序切分成n片,返回当前切片值

 注如果切片不均匀,默认增加第一个切片的分布

SELECT cookieid,createtime,pv,
NTILE(2) OVER(PARTITION BY cookieid ORDER BY createtime) AS ntile1, --分组内将数据分成2片
NTILE(3) OVER(PARTITION BY cookieid ORDER BY createtime) AS ntile2,  --分组内将数据分成3片
NTILE(4) OVER(PARTITION BY cookieid ORDER BY createtime) AS ntile3   --将所有数据分成4片
FROM test1;

è¿éåå¾çæè¿°
SELECT cookieid,createtime,pv, NTILE(3) OVER(PARTITION BY cookieid ORDER BY pv DESC) AS ntile

FROM test1

where ntile=1;

 3,ROW_NUMBER 函数

应用场景:获取分组内排序第一的记录、获取一个session中的第一条refer等

SELECT cookieid,createtime,pv,

ROW_NUMBER() OVER(PARTITION BY cookieid ORDER BY pv desc) AS rn

FROM test1;

è¿éåå¾çæè¿°

 rankdense_rankrow_number三者对比:

SELECT cookieid,createtime,pv,
RANK() OVER(PARTITION BY cookieid ORDER BY pv desc) AS rank1,
DENSE_RANK() OVER(PARTITION BY cookieid ORDER BY pv desc) AS d_rank2,
ROW_NUMBER() OVER(PARTITION BY cookieid ORDER BY pv DESC) AS rn3 
FROM test1;

è¿éåå¾çæè¿°

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值