点击流(Click Stream)是指用户在网站上持续访问的轨迹。通过对网站日志的分析可以获得用户的点击流数据。
用户在访问多个网页时,网页与网页之间是靠Referrers参数来标识上级网页来源。由此,可以确定网页被依次访问的顺序,当然也可以通过时间来标识访问的次序。其次,用户对网站的每次访问,可视作是一次会话(Session),在网站日志中将会用不同的Sessionid来唯一标识每次会话。
1.2 点击流模型生成
点击流数据在具体操作上是由散点状的点击日志数据梳理所得。点击数据在数据建模时存在两张模型表Pageviews和visits
页面点击流模型Pageviews表,这个模型强调的是对一个用户的一次访问session的信息识别
Session |
IP地址 |
时间 |
访问页面URL |
停留时长 |
第几步 |
S001 |
101.0.0.1 |
2012-01-01 12:31:12 |
/a/.... |
30 |
1 |
S002 |