窗口函数之ntile()函数讲解

ntile

NTILE(n),用于将分组数据按照顺序切分成n片,返回当前切片值。将一个有序的数据集划分为多个桶(bucket),并为每行分配一个适当的桶数(切片值,第几个切片,第几个分区等概念)。它可用于将数据划分为相等的小切片,为每一行分配该小切片的数字序号。

NTILE不支持ROWS BETWEEN,比如NTILE(2) OVER(PARTITION BY dept_no ORDER BY salary ROWS BETWEEN 3 PRECEDING - AND CURRENT ROW)。

如果切片不均匀,默认增加第一个切片的分布。

例如:

SELECT name, dept_no, salary,
       ntile(2) over(order by salary) n1,-- 全局按照salary升序排列,数据切成2份
       ntile(2) over(partition by dept_no order by salary) n2, -- 按照dept_no分组,在分组内按照salary升序排列,数据切成2份
       ntile(3) over(partition by dept_no order by salary) n3 -- 按照dept_no分组,在分组内按照salary升序排列,数据切成3份
FROM data;

这个函数用什么应用场景呢?假如我们想要统计一个cookie,pv数最多的前1/3的天。

SELECT
id,
date,
pv,
NTILE(3) OVER(PARTITION BY id ORDER BY pv DESC) AS rn 
FROM data;


rn = 1的记录,就是我们想要的结果。

+---+----------------+---+---+
|id |date            |pv |rn |
+---+----------------+---+---+
|1  |2015-04-12      |7  |1  |
|1  |2015-04-11      |5  |2  |
|1  |2015-04-10      |1  |3  |
|2  |2015-04-14      |4  |1  |
|2  |2015-04-15      |4  |2  |
|2  |2015-04-13      |3  |3  |
|3  |2015-04-16      |4  |1  |

——————————————————————————————

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值