网站流量日志数据分析

本文探讨了网站流量日志的数据分析,包括点击流数据模型的生成,网站转化的漏斗分析,流量指标,以及数据处理流程。重点介绍了数据采集、预处理、入库、分析和展示的步骤,并提到了使用的技术如Flume、MapReduce、Hive、Echarts等。
摘要由CSDN通过智能技术生成

1 点击流数据模型

1.1 点击流概念

        点击流(Click Stream)是指用户在网站上持续访问的轨迹。通过对网站日志的分析可以获得用户的点击流数据。

        用户在访问多个网页时,网页与网页之间是靠Referrers参数来标识上级网页来源。由此,可以确定网页被依次访问的顺序,当然也可以通过时间来标识访问的次序。其次,用户对网站的每次访问,可视作是一次会话(Session),在网站日志中将会用不同的Sessionid来唯一标识每次会话。

1.2  点击流模型生成

        点击流数据在具体操作上是由散点状的点击日志数据梳理所得。点击数据在数据建模时存在两张模型表Pageviews和visits

        页面点击流模型Pageviews表,这个模型强调的是对一个用户的一次访问session的信息识别

Session

IP地址

时间

访问页面URL

停留时长

第几步

S001

101.0.0.1

2012-01-01 12:31:12

/a/....

30

1

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值