一、什么是独立ip、pv、独立访客?
     1、独立IP数量,是指使用不同ip地址的用户访问网站的数量。同一IP不管访问了几个页面,独立IP数均为1,目前通行的做法是同一ip在24小时内访问只计数1次。这种做法是符合目前大多数广告投入者的计算习惯的。
     2、pv,也就是页面浏览的人次计数,不同统计系统对此定义或多或少均不一样,主要是采取以下方法,即刷新一个页面即增加计数1,不管是否恶意刷新或连续刷新。但我认为,真正的pv统计是应该结合IP的,即某ip24小时内访问不同页面的次数,如这就意味着同一ip在24小时内访问同一页面无论多少次,均只计数1,只有访问不同页面才能增加pv计数。
     3、独立访客是指不同用户计数,应该是只要被认定为不同用户均应增加计数,但从目前的技术角度是无法或很难判断是否是独立用户,比如以下情况,多人共用一个ip上网,同一用户动态ip上网,同一ip和同一机器不同用户上网。
  二、基于24小时IP的统计具体是怎么工作的?
    把您的网站的24小时内每个来访者的IP保存在数据库的一个临时表中,当有新的浏览者访问您的网站时,系统会先将他的IP同临时表中已有的IP进行对比,如果他的IP地址已经出现在临时表中,则认为他已经在您的网站上,他只是切换了页面而已。如果他的IP地址没有出现在临时表中,则认为他是今天的一个新的来访者并将他的IP地址保存在临时表中。通过分别对待临时表中的用户id,则实现,如果一个访问者先访问了多用户统计系统中另外一个用户网站,然后又访问了您的网站,仍然会认为他是您的网站的新访问者。
  三、代码放置技巧
   众所周知,不管国外还是国内,大牌还是小牌的网站统计系统都有死机的时候,因为这些服务器负载都是非常重的,各种原因都能导致系统暂时性的死机。所以,放置统计代码是非常有学问的。如果你把代码放到你页面内容的上面,或者即使是下面但是在一个table或者div标签里,在统计服务器死机的时候,你的页面上那个table或者div都会产生几十秒的延迟,导致你页面很长时间才能出来。所以,正确的放置统计代码的方法应该是,把统计代码放到你页面的最下面,并且不要和你的页面内容同在一个table或者div标签里。可以在最下方直接放置,或者在最下方单独做一个table或者div来放置计数器。这样在计数器死机的时候,你的网站也不会受到丝毫的影响。
  四、从原理来说现实
    作为统计系统来说,实现更多功能、实现精确统计必然导致资源的消耗,影响效率和稳定,但因此追求一个平衡点才是最重要的。
  五、哪一个更准确?
    明白了以上统计原理,就可以解释为什么不同统计系统数据不一样了。在不考虑硬件和网络性能的基础上,举几个例子!
    1、比如ip统计,有的是24小比对,有的是12小时(或其他)比对,自然后者比前者统计数值要大。
    2、比如pv统计,有的是同时比对ip和页面,有的是无防刷新机制,刷新一次增加一次,自然后者要比前者统计数值大。
    3、比如统计代码一般是javascript脚本调用,如果没有加浏览器不支持javascript时容错机制,那肯定是漏统计了。
  六、如何选择一个好的免费统计?
    很多人可能要说,这有什么好说的呢?不然,您可能就没注意以下几个方面:
    1、不要贪求多功能,提供更多的功能必然导致资源的消耗和效率的下降,很多扩展功能对绝大多数用户来说,并不需要,而且在很大程度上影响整体的性能同时让用户查看各种复杂数据产生困惑。统计功能如果可以满足您最常用和最需要的,就是好的统计系统。
  2、最好选择建立在unix类系统上的统计系统,一般来说这样总比windows平台的系统要稳定的多。
  3、ip统计必须是基于24小时比对的,pv统计应该基于页面和ip的,这样pv统计更准确。
  4、统计系统第一要务是统计,但如果通过统计系统能够给用户带来流量那肯定是值得选用的。因为通过您的网站到达免费统计的流量,远比通过免费统计系统到达您的网站流量大,可以说广大用户给免费统计系统带来了可观的访问量,因此如果免费统计系统能给用户一定机会的展示,这才是最公平的。
  5、查看统计资料的页面不能有太多的广告,一是影响查看资料,二是某些广告会给自己的网站带来负面影响。
  七、第三方流量统计一般都是这么来做的
使用第三方流量统计的页面被客户端打开后,在客户端浏览器中下载了统计脚本脚本并执行脚本里面的函数,该函数会把当前浏览器的信息、访问者的信息及当前页面信息提交到第三方的服务器,提交数据中还有一个网站标示ID,用来区分不同的网站的,最后第三方统计服务器会定期对提交上来的数据进行分析和汇总,就形成了大家看到的流量统计图。
据我所知,脚本提交客户端的信息包含:
.当前页面URL(做页面点击量分析)
.访问者IP地址(可以分析出访问者地域)
.该页面的前一个页面地址(点击来源)
.浏览器版本信息
.操作系统版本信息