Hive-窗口函数

        OVER():指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变而变化。

CURRENT ROW:当前行

n PRECEDING:往前 n 行数据

n FOLLOWING:往后 n 行数据

UNBOUNDED:起点,

         UNBOUNDED PRECEDING 表示从前面的起点,

         UNBOUNDED FOLLOWING 表示到后面的终点

LAG(col,n,default_val):往前第 n 行数据

LEAD(col,n, default_val):往后第 n 行数据

NTILE(n):把有序窗口的行分发到指定数据的组中,各个组有编号,编号从 1 开始,对 于每一行,NTILE 返回此行所属的组的编号。注意:n 必须为 int 类型。 

数据准备:name,orderdate,cost 

jack,2017-01-01,10
tony,2017-01-02,15
jack,2017-02-03,23
tony,2017-01-04,29
jack,2017-01-05,46
jack,2017-04-06,42
tony,2017-01-07,50
jack,2017-01-08,55
mart,2017-04-08,62
mart,2017-04-09,68
neil,2017-05-10,12
mart,2017-04-11,75
neil,2017-06-12,80
mart,2017-04-13,94

将数据写入到data目录下的t.txt文件中 

创建 hive 表并导入数据 

create table bus(
    name string,
    orderdata string,
    cost int
    )ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';
load data local inpath "/opt/module/data/business.txt" into table bus;

需求:

(1)查询在 2017 年 4 月份购买过的顾客及总人数

使用substring函数过滤数据

select * from bus where substring(orderdata,0,7) = '2017-04';

使用distinct函数完成对购买过的顾客

select distinct(name) from bus where substring(orderdata,0,7) = '2017-04';

 使用over窗口函数

select name,count(*) over () 
from bus
where substring(orderdata,1,7) = '2017-04'
group by name;

(2)查询顾客的购买明细及月购买总额

select name,orderdata,cost,sum(cost) over(partition by month(orderdata)) 
from business;

(3)上述的场景, 将每个顾客的 cost 按照日期进行累加

select 
name,orderdata,cost,sum(cost) over(partition by name order by orderdata rows between 1 
PRECEDING and current row)
from bus;

(4)查询每个顾客上次的购买时间

select name,orderdata,cost,
lag(orderdata,1,'1900-01-01') over(partition by name order by orderdata ) 
from bus;

(5)查询前 20%时间的订单信息

select * from (
 select name,orderdata,cost, ntile(5) over(order by orderdata) sorted
 from bus
) t
where sorted = 1;

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

open_test01

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值