Hive
文章平均质量分 82
ckSpark
爱好摄影、探险,终生学习
展开
-
大数据-Hive开窗函数
Hive开窗函数结构:xx() over(partition by xx order by xx)Hive开窗函数,大致有以下两类:1. 排序开窗函数row_number():组内排名后获取行号rank():组内排名(连续)dense_rank():组内排名(跳跃)first_value()last_value()lag(col, n, default):用于统计窗口内往上取第n个值lead(col, n, default):用于统计窗口内往下取第n个值cume_dist(col):计原创 2021-12-20 22:42:06 · 3406 阅读 · 0 评论 -
数据运营-常见问题 留存率/连续登陆等(SQL & Hive)
一、问题1:留存率计算字段及表说明:表名:user_log字段名:log_day:登录日期device_id:用户设备idapp_id:用户app的id,其中device_id和app_id确定唯一的用户1.1计算某日留存率(次日、3日、7日、30日)--计算次日、3日、7日、30日留存率select log_day,count(user_id_d1)/count(user_id...原创 2019-02-02 21:48:49 · 27135 阅读 · 10 评论