AB测试——原理介绍（中心极限定理、大数定理、假设检验、两类错误）

Avasla

已于 2023-03-10 14:28:41 修改

阅读量3.6k

点赞数

分类专栏：其他文章标签： ab测试

于 2023-01-12 16:44:11 首次发布

本文链接：https://blog.csdn.net/WHYbeHERE/article/details/128660075

版权

其他专栏收录该内容

30 篇文章

订阅专栏

作为AB测试的学习记录，本文主要整理总结了AB测试背后的数学原理和一些概念解释。

1、控制变量法

基于控制变量法的思想，通过对比两组样本（实验组和对照组）的表现是否有差异，从而验证“变量”的作用。

借用中学生物课上的例子：探究种子萌发的环境条件的实验。
在这里插入图片描述

为了确定阳光对种子萌发有影响，需要确保除光照外所有环境变量一致。实验需要设置实验组和对照组，其中，对照组是正常接受光照的种子（没有其他特殊待遇）；实验组是黑暗环境下的种子（有特殊待遇：没有光照）。

最后通过对比两组种子的发芽情况，得出“阳光对种子是否有影响”的结论。此外，还可以对比水分、温度等等环境变量对种子萌发的影响。

同理，在实际的商业环境中，用户就像是这些待发芽的种子，我们可以通过控制产品设计、营销策略、推荐算法等等“变量”，去提高它们的“萌芽率”——活跃度、留存率、消费金额等等。因此，我们需要进行AB实验去检验各种策略、设计对公司的运营是有效的。

简言之，AB测试是一种评估运营方案是否有效的实验方法。当不确定两种（或者多种）待选方案中哪个表现更好时，通过直接的实验手段去验证，找出最佳的解决方案。

但这种实验的前提是，样本量足够且变量可以控制。若样本量不足，例如刚上架的APP没有多少注册用户也就没有实验的必要性。

2、中心极限定理VS大数定理

2.1 中心极限定理

随着试验次数的增加，一组独立同分布的变量的均值可以近似看作服从正态分布，且方差也会随着试验次数的增加而减小。简言之，无论总体是什么分布，只要样本量足够大，样本的均值分布都会趋于正态分布。

具体的验证过程可以查看笔记《Python验证中心极限定理》。

样本和总体都呈正态分布，样本量的均值和总体均值一致。当N固定时，样本的均值和总体一致，样本的方差等于总体的方差/N

独立同分布：指随机过程中，任何时刻的取值都为随机变量，如果这些随机变量服从同一分布，并且互相独立。比如掷色子，第一次和第二次掷出的结果都不会相互影响，而且结果是随机的。
在这里插入图片描述

2.2 大数定理

大数定律的核心在于将随机变量X所对应的随机试验重复多次，随着试验次数的增加，X的均值会愈发趋近于E(X)。即，样本量越大，越靠近总体。

2.3 两个原理的区别

中心极限定理是说无论抽样分布如何均值服从正态分布；而大数定律根本和正态分布无关，是说样本大了抽样分布近似总体分布。

3、假设检验

1）提出假设

原假设 (null hypothesis，H0)：需要拒绝掉的假设，我们不希望看到的结果：新方案对核心指标不会有显著性影响。
备择假设 (alternative hypothesis，H1)：和原假设相反的假设，是我们想要的结果：新方案对核心指标有显著性影响。

PS：在提出假设这一步，我个人的难点是总记不住两个假设的定义。后面知道了一句顺口溜：“越小越拒绝"，意思是P值越小，越拒绝原假设。然后联想推出：P值越小越好，所以在对P值进行判断时，记住不要大的数，越接近0越好。P值越小，我们越要拒绝的原假设。既然原假设是用来拒绝的，那么原假设就是我们不想要的那个结果。