AB实验_如何确定实验周期

本文讨论了在实施AB实验时如何选择评估数据,特别是在处理不同周期数据和避免多重检验问题上。介绍了MDE的概念,它是业务方对实验效果信心的量化,影响样本量计算。文章详细讲解了如何根据MDE、方差、统计功效和一类错误概率确定最小样本量,以及如何考虑周期效应来确定实验周期。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在实操AB实验时往往会遇到一个问题:我们应该取哪一段的实验数据来评估实验效果呢?如果取数周期不一致的话,实验效果自然不一致;而且多次取不同周期的数据来评估的话,又会犯多重检验的错误,提高了第一类错误的概率(错误地拒绝原假设)。那应该怎么办呢?

目前有两种,一种是需要提前计算最小样本量确定实验周期,到期后才能评估实验,在未达到实验周期时不评估实验,即使实验中间显著了也不能作为评估的最终结果;另一种则是序贯检验这种,不需要提前计算最小样本量确定实验周期,可以持续观察实验,等显著了后就可以直接作为结果。本文章重点讲第一种如何确定实验周期。

一般是业务方给出核心指标的MDE,数据分析师通过历史数据计算核心指标的方差,最终数据分析师根据MDE、方差、一二类错误上限计算出最小样本量,根据可用流量比例计算出实验周期。如果实验指标有明显的周中周末效应,那实验周期最好为7n天为佳。

什么是MDE

MDE:Minimum Detectable Effect,最小可检测效应。

MDE代表着业务方对实验组和对照组差异的信心,信心越强,给出的MDE

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

fff2zrx

谢谢老板

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值