hive:窗口函数/开窗函数 OVER()(笔记)

本文详细介绍了Hive中的窗口函数(开窗函数),包括相关函数说明、数据准备、具体需求示例,如查询特定月份的顾客及购买总数、顾客月购买总额、成本累计、购买时间对比以及前20%订单信息等。通过多个实际场景的应用,展示了窗口函数在数据分析中的强大功能。
摘要由CSDN通过智能技术生成

窗口函数(开窗函数)

1.相关函数说明

OVER():指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变而变化。
CURRENT ROW:当前行
n PRECEDING:往前n行数据
n FOLLOWING:往后n行数据
UNBOUNDED:起点,UNBOUNDED PRECEDING 表示从前面的起点, UNBOUNDED FOLLOWING表示到后面的终点
LAG(col,n,default_val):往前第n行数据
LEAD(col,n, default_val):往后第n行数据
NTILE(n):把有序分区中的行分发到指定数据的组中,各个组有编号,编号从1开始,对于每一行,NTILE返回此行所属的组的编号。

注意:
(1)n必须为int类型。
(2)over是对左边的结果集重新进行开窗计算!!!比如group by name,基于这个结果集后的数据再次进行开窗计算
(3)over()里边不传参数,开的窗口是基于所有数据。
(4)开窗是针对每一条数据进行开窗。

2.数据准备:

name,orderdate,cost
jack,2017-01-01,10
tony,2017-01-02,15
jack,2017-02-03,23
tony,2017-01-04,29
jack,2017-01-05,46
jack,2017-04-06,42
tony,2017
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值