在实操AB实验时往往会遇到一个问题:我们应该取哪一段的实验数据来评估实验效果呢?如果取数周期不一致的话,实验效果自然不一致;而且多次取不同周期的数据来评估的话,又会犯多重检验的错误,提高了第一类错误的概率(错误地拒绝原假设)。那应该怎么办呢?
目前有两种,一种是需要提前计算最小样本量确定实验周期,到期后才能评估实验,在未达到实验周期时不评估实验,即使实验中间显著了也不能作为评估的最终结果;另一种则是序贯检验这种,不需要提前计算最小样本量确定实验周期,可以持续观察实验,等显著了后就可以直接作为结果。本文章重点讲第一种如何确定实验周期。
一般是业务方给出核心指标的MDE,数据分析师通过历史数据计算核心指标的方差,最终数据分析师根据MDE、方差、一二类错误上限计算出最小样本量,根据可用流量比例计算出实验周期。如果实验指标有明显的周中周末效应,那实验周期最好为7n天为佳。
什么是MDE
MDE:Minimum Detectable Effect,最小可检测效应。
MDE代表着业务方对实验组和对照组差异的信心,信心越强,给出的MDE