电商日志分析

电商日志分析

项目中名词

  • 用户/访问
    • 不知道是否是本网站的会员,处于未登陆状态
    • 表示同一个浏览器代表的用户,唯一标示用户
    • 我们可以使用cookie来标识用户,但是不同浏览器cookie之间是不能共享
    • cookie只能代表同一个浏览器代表的客户
  • 会员
    • 该用户已经登陆了系统
    • 可以把会员的信息唯一标识当成这个人
  • 会话
    • 用户在一段时间内的操作
    • 我们可以通过操作来模拟会话,时间,ID
  • PageView
    • 页面被访问的次数
    • 经常用来统计网站的访问量
  • Ip
    • 明天有多少个不同IP在访问这个网站
  • 数据计算
    • 去重
      • 活跃用户—>如果一个用户今天登陆的系统,就属于日活数的范畴
    • 相减
      • 用户在页面的停留时间

业务分析

  • 产生收集处理数据的时候
    • 数据=通用数据+特征数据
    • 通用数据=浏览器类型+日期+语言+编码格式+开发平台
    • 特征数据=日志类型+用户信息/会员信息+事务类型
  • 数据的处理流程
    • 数据的处理流程===>web+前端 传递到指定的服务器进行收集
    • 数据处理===>大数据集群分析处理,将数据存放到关系型数据库
    • 数据展示===>web+前端
  • 大数据分析的结果
    • 维度
      • 查询数据的一个角度,或者分析数据的一个标准
    • 指标
      • 当前维度获取的数据
  • 维度有哪些
    • 用户
    • 会员
    • 浏览器
    • 时间
    • 区划
    • 外链
    • 订单
    • 自定义事件

日志的来源SDK

日志的来源广泛,但是日志会被收集到专门的日志服务器上

服务器端

  • java(开发一个日志接口)
  • 都会把数据传递给指定的日志服务器.专门收集用户的日志

客户端

  • HTML+CSS+JS

  • 要使用uuid来标识用户的唯一性,因为ip有可能被多个人所共享

  • 客户端流程

    • 当用户进入到页面的时候,判断会话是否过期

      • 未过期:用户存在,会话也存在,直接发送pageview,更新会话时间

      • 已过期:判断会话过期的原因

        • 时间超时

          • 创建一个新的session,将新会话ID存放到cookie
          • 然后发送pageview,更新会话时间
        • 第一次访问

          • 首先生成用户的标识UUID,然后存放到cookie,失效时间特别长 10年

          • 然后创建session,将新会话id存放到cookie

          • 因为是新用户,发送launch时间,标识当前请求是新用户

          • 然后发送pageView.更新会话时间

      • 整个流程

        • 名词访问页面肯定会收集到数据(用户,会话,pv)
        • 第一次访问收集的信息为laun
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值