目录
1 分析的意义
(1) 优化页面及业务流程设计,提高流量转化率。
(2) 帮助企业对客户群进行细分,针对不同客户制定个性化的促销策略.
2 Web访问日志
访问日志指用户访问网站时的所有浏览、点击行为数据.
2.1 日志来源
(1) web服务器软件(httpd、nginx、tomcat)自带的日志记录功能;
(2) 自定义采集用户行为数据,通过在页面嵌入自定义的javascript代码来获取用户的访问行为,然后发送到后台记录日志.
2.2 数据分类
2.2.1 按类型分
(1) 页面浏览(展现)日志:页面被浏览器加载呈现时采集的日志.
(2) 页面交互日志:当页面加载和渲染完成之后,用户可以在页面上执行各类操作.
2.2.2 按内容分
(1) 系统特征:比如所采用的操作系统、浏览器、域名和访问速度等。
(2) 访问特征:包括停留时间、点击的URL、页面属性,来访URL,来访IP等。
(3) 业务自定义属性.
2.3 日志搜集原理
(1) 用户行为触发http请求,页面中的埋点javascript代码会被执行.
埋点javascript代码:在网页中预先加入小段javascript代码,这个代码片段一般会动态创建一个script标签,并将src属性指向一个单独的js文件(数据收集脚本)
(2) 数据收集完成后,js会请求一个后端的数据收集脚本,这个脚本一般是一个伪装成图片的动态脚本程序,js会将收集到的数据通过http参数的方式传递给后端脚本,后端脚本解析参数并按固定格式记录到访问日志.
3 日志处理流程图