Hive分析、窗口函数

一、LAG与LEAD

LAG(col,n,default) 用于统计窗口内往上第n行值

第一个参数为列名,第二个参数为往上第n行(可选,默认为1),第三个参数为默认值(当往上第n行为NULL时候,取默认值,如不指定,则为NULL)

LEAD与LAG相反 ,LEAD(col,n,DEFAULT) 用于统计窗口内往下第n行值

第一个参数为列名,第二个参数为往下第n行(可选,默认为1),第三个参数为默认值(当往下第n行为NULL时候,取默认值,如不指定,则为NULL)

例子:获取用户这次下单与下次会话的时间,统计时间差

select session_id, user_id, session_create_time, 
LEAD(session_create_time,1) over (order by session_create_time asc) as next_row 
from dwb.dwb_pulsar_c_inappropriate_hour
where user_id = '1105835577';

获取上一次与这一次下单的间隔时间

select session_id, user_id, session_create_time, 
LEAD(session_create_time,1) over (order by session_create_time asc) as next_row,
datediff(LEAD(session_create_time, 1) over(order by session_create_time asc),session_create_time) as diff_days
from dwb.dwb_pulsar_c_inappropriate_hour
where user_id = '1105835577';

二、ROW_NUMBER()排序实现

 

SELECT
   user_id, session_id, session_create_time,
   ROW_NUMBER() OVER(PARTITION BY user_id ORDER BY session_create_time DESC) AS rank
FROM dwb.dwb_pulsar_c_inappropriate_hour
ORDER BY user_id;

排序后取出user_id分组,session_create_time 最前面的结果

其他方式实现

方法一: ROW_NUMBER() OVER(PARTITION BY

SELECT t.user_id, t.session_id, t.session_create_time
FROM( 
SELECT
   user_id, session_id, session_create_time,
   ROW_NUMBER() OVER(PARTITION BY user_id ORDER BY session_create_time DESC) AS rank
FROM dwb.dwb_pulsar_c_inappropriate_hour
)t
WHERE t.rank = 1 ORDER BY t.user_id;

 方法二: rowNumberInAllBlocks()函数

SELECT t.user_id, t.session_id, t.session_create_time
FROM( 
SELECT
    user_id, session_id, session_create_time,
    rowNumberInAllBlocks() AS rank
FROM dwb.dwb_pulsar_c_inappropriate_hour
)t
LIMIT 1 BY user_id;

方法三:max()函数

SELECT t.user_id, t.session_id, t.session_create_time
FROM
dwb.dwb_pulsar_c_inappropriate_hour a
left join ( 
SELECT
    user_id, max(session_create_time) session_create_time
FROM dwb.dwb_pulsar_c_inappropriate_hour
GROUP BY user_id
)t
on a.user_id = t.user_id 
and a.session_create_time = t.session_create_time;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值