Hive统计每日新增及其二日和三十日回访比例

数据如下:
user_id	opr_type	log_time1

一、求每日新增
方法:每日新增即用户第一次访问,那么此时按照用户的id为key做分组,求他访问的最大时间和最小时间(天);
如果最大时间等于最小时间,那么说明用户是第一次访问,否则不是;那么总的来说就是按照用户的最小时间统计即可

select
  min_date,count(distinct user_id) as per_day_new
from
(
  select
    user_id,
    min(log_date) as min_date
  from table
  group by user_id
)t
group by min_date;

该sql就能统计出来每日的新增用户数

二、求二日和三十日的回访比例
回访比例计算公式=二日回访用户数/总体用户数;由该公式可知需要计算二日和三十日回访的用户数,以及求总体的用户数;

select
  round(second_log_cnt/float(cnt), 3) as second_log_rate,
  round(thirty_log_cnt/float(cnt), 3) as thirty_log_rate
from
(
  select
    count(distinct user_id) as cnt,
    count(distinct if(date_rank=1,user_id,null)) as second_log_cnt,
    count(distinct if(date_rank=30,user_id,null))  as thirty_log_cnt
  from
  (
    select
      user_id,
      log_date,
      dense_rank() over(partition by user_id order by substr(log_time, 0, 10) asc) as date_rank
    from table
  )t
)tt
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值