采样是Google Analytics处理大量数据时的一种方法。可以快速完成查询并生成所需报告。如果你的网站每个月有几百万的综合浏览量,就需要用到采样。Google Analytics中的采样分为客户端采样和报告采样两种。
客户端采样
默认情况下Google Analytics会追踪网站的所有流量。但当网站流量超过一定量时,会产生一些问题。
1 、超过Google Analytics数据库存储每日记录的上限。
2 、在报告中触发自动采样。
客户端采样是通过手动修改网站的追踪代码,按照预先设定的百分比直接从网站中收集采样数据的。实施起来很简单,在追踪代码中调用_setSampleRate()然后设置一个采样百分比作为参数就可以了。设置客户端采样后,Google Analytics将不在追踪网站的所有流量,而是按照设定的采样比例收集流量数据。
客户端采样代码:
1
2
|
pageTracker._setSampleRate(
'80'
);
//传统追踪代码的采样设置,采样率80%
_gaq.push([
'_setSampleRate'
,
'80'
]);
//异步追踪代码的采样设置,采样率80%
|
客户端采样时一个不可逆的过程,当设置了采样后,配置文件及报告中将只显示采样后的数据。而网站中未被采集的数据将无法找回。所以,你可以试着将采样数据发送到一个配置文件中,而将未采样的原始数据保留在另一个配置文件中。
1
2
3
4
5
6
7
8
9
10
|
<!—Bluewhale GA tracking code begin-->
<script type=
"text/javascript"
src=
"http://www.google-analytics.com/ga.js"
></script>
<script type=
"text/javascript"
>
var
pageTracker = _gat._getTracker(
"UA-1111111-1"
);
pageTracker._trackPageview();
var
pageTracker = _gat.getTracker(
"UA-1111111-2"
);
pageTracker._setSampleRate(
'80'
);
pageTracker._trackPageview();
</script>
<!-- Bluewhale GA tracking code end-->
|
报告采样
报告采样是另一种采样方法,无论之前是否设置了客户端采样,当报告中的数据满足一定条件时,采样都会被自动触发。当报告采样被触发后,报告的顶部会出现黄色的采样通知。例如:当对报告中的超过50万访次的度量进行维度交叉细分时,报告采样就会被触发。同时在报告顶部有黄色标记提示:此时报告中的部分数据为采样数据。
在采样报告中,一部分值是系统的估算值,而另一部分值是真实值。例如:在下面的采样报告中,总访问次数和报告记分卡中的值是真实值,而维度组合和访次的详细报告值是估算值。
采样数据可信度
在采样报告的详细报告中,每个数据后面都会有一个置信区间来表示数据的可信度,一般分为三种情况,完全可信,在某个范围内可信,和不可信。区间范围的大小表示数据的可信度。置信区间越小表示数据越可信。当置信区间为0时表示数据没有经过采样或估算,完全准确。不过这种情况一般不会出现在采样报告中。
在上图的采样报告中,第一个访次数据的置信区间显示大于0,表示已经很接近真实值了。第二个访次的数据是20,519,置信区间+/-2%,表示这个指标真实值的范围在20,109—20,929之间。
在某些情况下,采样报告的数据可信区间会显示为一个*号。这表示样本数据所占比例过小,这类数据不可信。(转:蓝鲸网站分析)