hive
LafreeBing泉
慎独
展开
-
hive 求五分钟之内访问次数达到100次的用户
字段有useriddt(timeStamp)url(10亿pv量)求黑名单求五分钟之内访问次数达到100次的用户离线思路:dt - lag(dt,100) over(distribute by userid sort by dt asc)<五分钟实时思路:滑动窗口函数...原创 2018-12-25 09:55:23 · 2624 阅读 · 0 评论 -
hive 级联求和 窗口函数
Hive窗口函数LAG案例替换级联求和需求:原始数据:A,2015-01,5A,2015-01,15B,2015-01,5A,2015-01,8B,2015-01,25A,2015-01,5A,2015-02,4A,2015-02,6B,2015-02,10B,2015-02,51、表的创建和加载:create table t_access_times(usernam...原创 2019-02-23 19:08:33 · 870 阅读 · 0 评论