大数据-Hive开窗函数

Hive开窗函数结构:
xx() over(partition by xx order by xx ROWS/RANGE between xx and xx)

一、Hive开窗函数,大致有两类:排序开窗、聚合开窗
1. 排序开窗函数
row_number():组内排名后获取行号
rank():组内排名(排名可能不连续)
dense_rank():组内排名(排名连续)
percent_rank():计算给定行的百分比排名,可以用来计算超过了百分之多少的人。(当前行的rank值-1)/(分组内的总行数-1)

first_value()
last_value()

lag(col, n, default):用于统计窗口内往上取第n个值
lead(col, n, default):用于统计窗口内往下取第n个值

cume_dist(col):计算某窗口或分区中截止某值时的累积分布。假定升序排序,则累积分布=小于等于当前值x的行数/分区内的总行数。
ntile():将分区中已排序的行划分为大小尽可能相等的指定数量的排名的组,并返回给指定行所在组的排名。

2. 聚合开窗函数

sum()
count
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值