本节书摘来自异步社区《流量的秘密: Google Analytics网站分析与优化技巧(第3版)》一书中的第2章,第2.1节,作者【英】Brian Clifton,更多章节内容可以访问云栖社区“异步社区”公众号查看
第2章 网站分析的现有方法及其准确性
流量的秘密: Google Analytics网站分析与优化技巧(第3版)
网站分析与其他传统的营销方案相比,能获得更多海量的信息,因而也更具洞察力。然而,如果只是不加分析地单从表面上应用这些海量信息,其后果也是不堪设想的。因此,要保证网站分析数据的准确性。
有效利用这些海量信息的关键是熟悉你的数据——数据能反映什么,不能反映什么,以及数据的局限性在哪里。这就要求我们需要了解数据收集的方法和技术。本质上,有两种常用的数据收集技术:页面标签技术和服务器日志技术。Google Analytics使用的是页面标签技术。
在第2章中,你将学习到以下内容。
- 如何收集访客数据
- 页面标签技术相对于服务器日志技术的优势
- cookie在网站分析中扮演的角色
- 网络信息准确性所受到的限制
- 怎样考虑网站分析与用户隐私之间的关系
2.1 页面标签与日志文件
流量的秘密: Google Analytics网站分析与优化技巧(第3版)
页面标签技术通过访客浏览器收集数据,并将这些数据发送到远程数据接收服务器,分析人员可以从远程服务器查看数据报告,如图2.1所示。这些信息通常通过放置在网站每个页面中的JavaScript代码(即tags和beacons)进行收集。有些服务提供商也会添加许多自定义标签来收集额外的数据。这项技术被称作客户端数据收集技术,主要被作为外部SaaS(软件即服务)服务提供商的解决方案使用。
![7c6a59391038cc0088705430d1abbc4f4914657f](https://i-blog.csdnimg.cn/blog_migrate/5081ffd3da1e450613d24c40eb648c9c.png)
注意:
Google Analytics提供的是页面标签技术的解决方案服务。
日志文件是指通过网站服务器而不依赖于访客的浏览器收集到的数据。网站服务器通常将访客的信息保留到同一个网段,甚至同一个服务器的本地文本文件上。分析者可以从本地服务器上看到报告,如图2.2所示。这项技术被称作服务器端的数据收集技术,它会采集网站服务器收到的所有请求,包括页面、图像、PDF等。这项技术主要被以单机授权提供服务的软件提供商使用。
![91fe91d7847f6ec775f10374e79125fdbb7d6045](https://i-blog.csdnimg.cn/blog_migrate/77fab8f7c3cf34737c281cc68549ac7c.png)
过去,日志文件简单易用的特点让它成为了解网站访客行为最常被采用的技术。事实上,大多数的网络服务提供商(ISP)都为他们的网站主机托管账户提供了免费的日志分析软件,用来分析他们的托管账号(如Analog、Webalizer、AWStats等)。尽管大多数人首次接触网站分析都是从这些免费软件开始的,但是当你需要监测访客行为的时候,这些免费工具就显得无能为力了。因此,本书不对这些基本的网站分析软件进行过多探讨。
近几年,页面标签技术成了最受欢迎的收集访客数据的标准方法。一方面,从技术角度来讲,页面标签技术更加容易实现;另一方面,由于数据是在第三方服务器(服务提供商)上采集和处理的,节约了网站管理者使用认证软件来获取、储存、归档的成本和维护费用,从而使数据管理需求大大降低。
需要注意的是,这两种技术在被分开考虑时,它们各自都有局限性。表2.1总结了两种技术的区别。有一种常见的错误观点是页面标签方法在技术上比其他方法更有优势。但是从表2.1中可以看到,这完全取决于你的需求。将这两种技术进行整合,往往能获得取长补短的效果,这就是所谓的混合法,有些服务提供商也能提供这种解决方案。
![c0fedb5def29e276ec58680d80e20edaae5ae473](https://i-blog.csdnimg.cn/blog_migrate/a121e428d55599ab219cc07b4bd647eb.png)
注意:
Google Analytics可以被配置为混合数据收集模式,可参考第6章。
其他数据收集方法
尽管页面标签技术和日志文件技术是目前为止应用最为广泛的访客数据收集方法,但它们并不是仅有的数据收集方法。例如网络数据收集设备(packet sniffers),它从路由器中收集数据存放到黑盒里。另一项技术则应用了网络编程接口,或者是加载一些小插件(也叫plug-in,但不是严格意义上的术语)。这些程序可以增强网站服务器的功能。例如,加强和拓展记录的信息,将这些信息实时发送到报告服务器上。
正如你所看到的,各个方法的优缺点可以互相平衡。然而,在免费软件这一类别中,SaaS页面标签技术因其易于实现和开销较低,目前为止是应用最为广泛的。