063 日志分析(pv  uv  登录人数  游客人数  平均访问时间  二跳率  独立IP)...

1.需求分析

  分析指标

    pv  uv  登录人数  游客人数  平均访问时间  二跳率  独立IP

 

2.使用的日志(一号店),会话信息

  

 

3.创建数据库

  

 

4.创建源表,存储源数据

  

 

5.创建我们需要的use表

  

 

6.创建两张临时表

  一张临时表可以根据sessionId得到的字段。

  第二张临时表是原表的过滤。

  思路:当第一张表的min_trackTime与第二张表的trackTime进行join,则这个时候的trackU,url,referer都是最小时间对应的值。

  

 

 7.join出想要的结果

  

 

8.完成需求

  

 

9.结果(使用beeline客户端显示)

  

 

10.疑问:

  visit_user的求解。

  count(distinct case when user_id is null then guid else null end) visit_user

  上面的使用方式是有问题的,没有登录的时候,user_id不是空,是别的值,所以都统计了,就造成了与UV相同。

  具体是啥?是空白符,但是要怎么做呢?

  可以统计长度。

  count(distinct case when length(user_id)!=0 then guid else null end) login_user;

   count(distinct case when length(user_id)=0 then guid else null end) visit_user;

 

转载于:https://www.cnblogs.com/juncaoit/p/6079233.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值