网站数据分析-Google Analytics与Webtrends数据误差

东芝又要写报告了,本季度报告监测工具换成了 Google Analytics ,以解决Webtrends一些数据缺失问题,但是数据差异真的很大,之前在首都机场的数据分析上也有类似的问题,在两套工具转换时,数据的差异是个不得不面对的困难,就看如何去说服客户了。

实际上网站分析无外乎两种形式,一种是Server Log 就是俗称的网站日志分析,另一种则是Page Tag俗称埋代码方式,这两种数据分析从数据取得上存在相当大的差异,随之产生了两种数据上的差异,总的来说Server Log 一定会大于Page Tag,但是两种方式都不是最准确的反应实际情况,我们看下这两种方式的实际情况:

Server Log的误差:
Unique Visitor的误差:

  • 如果用Server Log的方法监测数据,那么很显然,获取真实的访问者数量是不可能的任务。本身Server Log无法分析出真正的用户的,而网络爬虫/机器人/IP扫描的访问又使这种误差进一步扩大。
  • Page View的误差:本来Server Log是可以很准确的记录Page View的,但Cache极有可能会屏蔽服务器端的响应,这样Server Log可能不会留下任何关于某次Page View记录。
  • 时间记录的误差:在没有Cache干扰的情况下,服务器能准确探知访问开始的时间,但是访问结束的时间无法了解。因为访问结束往往是随关闭浏览器而一同结束的。关闭浏览器本身不能激发一条新的Server Log记录。
  • Flash站点误差:如果一个网站主要构成部分是包含多个页面的一个Flash文件,或多个此类Flash文件的组合,那么Server Log不会记录Flash内部的操作,监测会几乎失效。

Page Tag的误差:

  • Page Tag失效:Page Tag失效是会发生的。首先,一部分浏览器(例如手机上的一些浏览器)不支持JavaScript或者被设置为JavaScript禁止。其次,Page Tag可能会因为它之前的JavaScript出错而无法运行。再次,我们也看到过因为变量名冲突而发生Page Tag和页面上其他JavaScript冲突而无法运行的案例。最后,受网络速度的影响,页面上的Page Tag没有完全下载,浏览器就可能被人为关闭或者直接链向一个新的页面。
  • Page Tag的位置:Page Tag在页面中的位置会影响网站分析工具的计数。如果Page Tag在页面的上端,那么它会更快的被执行,计数也就会因此增大。
  • Unique Visitor的误差:一个计算机可能被多人使用;一个计算机可能有多个浏览器(造成访问同一个网站有多个Cookie);人们会删除Cookie(2007年comScore的统计表明,一个月内有30%的美国用户会删除浏览器的Cookie);Cookie被禁用(尽管WA工具一般都使用第一方Cookie,但仍有约10%不到的第一方Cookie会被用户设为禁止)。
  • Page View的误差:主要由Page Tag失效引起。
  • 时间记录的误差:同Server Log一样,Page Tag能够准确记录访问开始的时间,但是结束时间无法了解,因为一般情况下访问的结束并不会触发Page Tag的执行。

综上所述,serverlog形式数据量大主要因为没有屏蔽非用户访问数据,Page Tag数据低产生于对Tag是否完全访问。我们可以这样理解,如果一个用户是真实访问网站的话,访问时间不会低于10秒,低于10秒的访问我们均可认为数据属于非法数据,那么我们可以排除ServerLig的数据读取形式了,无怪乎从Webtrands7开始,也开始支持ServerLog形式了。我们再看剩下的PageTag方式,你Tag数据放到页面上方则保证10秒内一定会加载分析数据,如果放到下方,则更接近于真实访问用户。我们可以所以根据客户对数据要求的不同,选择Tag代码的位置。

 

转载自:http://www.iecosystem.com.cn/blog/?p=766

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值