Hive窗口函数(开窗函数)

1 )相关函数说明
OVER():指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变而变化。
CURRENT ROW :当前行
n PRECEDING :往前 n 行数据
n FOLLOWING :往后 n 行数据
UNBOUNDED :起点,
UNBOUNDED PRECEDING 表示从前面的起点,
UNBOUNDED FOLLOWING 表示到后面的终点
LAG(col,n,default_val) :往前第 n 行数据
LEAD(col,n, default_val) :往后第 n 行数据
NTILE(n) :把有序窗口的行分发到指定数据的组中,各个组有编号,编号从 1 开始,对
于每一行, NTILE 返回此行所属的组的编号。 注意: n 必须为 int 类型。
2 )数据准备: name orderdate cost

 

3 )需求
(1)查询在 2017 4 月份购买过的顾客及总人数
(2)查询顾客的购买明细及月购买总额
(3)上述的场景 , 将每个顾客的 cost 按照日期进行累加
(4)查询每个顾客上次的购买时间
(5)查询前 20% 时间的订单信息
4 )创建本地 business.txt ,导入数据
[atguigu@hadoop102 datas]$ vi business.txt
5 )创建 hive 表并导入数据

 

 6)按需求查询数据

(1) 查询在 2017 4 月份购买过的顾客及总人数

 

(2) 查询顾客的购买明细及月购买总额

 

(3) 将每个顾客的 cost 按照日期进行累加

 rows 必须跟在 order by 子句之后,对排序的结果进行限制,使用固定的行数来限制分

区中的数据行数量
(4) 查看顾客上次的购买时间

 

(5) 查询前 20% 时间的订单信息

 2.6 Rank

1 )函数说明
RANK() 排序相同时会重复,总数不会变
DENSE_RANK() 排序相同时会重复,总数会减少
ROW_NUMBER() 会根据顺序计算
2 )数据准备

 3)需求

计算每门学科成绩排名。
4 )创建本地 score.txt ,导入数据
[atguigu@hadoop102 datas]$ vi score.txt
5 )创建 hive 表并导入数据

 6)按需求查询数据

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大数据开发工程师-宋权

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值