电商日志分析
项目中名词
- 用户/访问
- 不知道是否是本网站的会员,处于未登陆状态
- 表示同一个浏览器代表的用户,唯一标示用户
- 我们可以使用cookie来标识用户,但是不同浏览器cookie之间是不能共享
- cookie只能代表同一个浏览器代表的客户
- 会员
- 该用户已经登陆了系统
- 可以把会员的信息唯一标识当成这个人
- 会话
- 用户在一段时间内的操作
- 我们可以通过操作来模拟会话,时间,ID
- PageView
- 页面被访问的次数
- 经常用来统计网站的访问量
- Ip
- 明天有多少个不同IP在访问这个网站
- 数据计算
- 去重
- 活跃用户—>如果一个用户今天登陆的系统,就属于日活数的范畴
- 相减
- 用户在页面的停留时间
- 去重
业务分析
- 产生收集处理数据的时候
- 数据=通用数据+特征数据
- 通用数据=浏览器类型+日期+语言+编码格式+开发平台
- 特征数据=日志类型+用户信息/会员信息+事务类型
- 数据的处理流程
- 数据的处理流程===>web+前端 传递到指定的服务器进行收集
- 数据处理===>大数据集群分析处理,将数据存放到关系型数据库
- 数据展示===>web+前端
- 大数据分析的结果
- 维度
- 查询数据的一个角度,或者分析数据的一个标准
- 指标
- 当前维度获取的数据
- 维度
- 维度有哪些
- 用户
- 会员
- 浏览器
- 时间
- 区划
- 外链
- 订单
- 自定义事件
日志的来源SDK
日志的来源广泛,但是日志会被收集到专门的日志服务器上
服务器端
- java(开发一个日志接口)
- 都会把数据传递给指定的日志服务器.专门收集用户的日志
客户端
-
HTML+CSS+JS
-
要使用uuid来标识用户的唯一性,因为ip有可能被多个人所共享
-
客户端流程
-
当用户进入到页面的时候,判断会话是否过期
-
未过期:用户存在,会话也存在,直接发送pageview,更新会话时间
-
已过期:判断会话过期的原因
-
时间超时
- 创建一个新的session,将新会话ID存放到cookie
- 然后发送pageview,更新会话时间
-
第一次访问
-
首先生成用户的标识UUID,然后存放到cookie,失效时间特别长 10年
-
然后创建session,将新会话id存放到cookie
-
因为是新用户,发送launch时间,标识当前请求是新用户
-
然后发送pageView.更新会话时间
-
-
-
整个流程
- 名词访问页面肯定会收集到数据(用户,会话,pv)
- 第一次访问收集的信息为laun
-
-