AB测试中如何给样本分组？

最新推荐文章于 2025-03-20 19:38:43 发布

jran_ml

最新推荐文章于 2025-03-20 19:38:43 发布

阅读量8.2k

点赞数 1

分类专栏： Machine Learning Statistics

本文链接：https://blog.csdn.net/zhanshirj/article/details/88403021

版权

Machine Learning 同时被 2 个专栏收录

3 篇文章

订阅专栏

Statistics

3 篇文章

订阅专栏

什么是AB测试？

AB测试大规模出现在互联网产品迭代更新中。为Web或App界面或流程制作两个（A/B）或多个（A/B/n）版本，在同一时间维度，分别让组成成分相似的访客群组访问这些版本，收集各群组的用户体验数据和业务数据，最后分析、评估出最好版本，正式采用。¹

假设Group1上的实验结果为 $r_1$ , Group2上的实验结果为 $r_2$ ，则AB测试的差异是 $r=r_1-r_2$ 。 $r$ 是依赖于测试样本的随机变量，应该满足：

无偏性。假设在1%流量上某功能可以提高10%的点击率，那么在全量上也应该大约提高10%。
低方差。 $r$ 是一个随机变量，方差越小，可靠性越高。

在这里插入图片描述

什么叫样本相似?

严格来说，应该是A, B两组样本的密度函数或分布函数相似。但在高维情况下，密度函数难以估计，以密度函数相似为标准的分组操作难度较大。退而求其次，A, B两组样本的边缘密度函数相似。具体来说，就是每个指标在A, B两组中要均衡。比如A组女性占比35%，那么B组女性占比也应约35%。这样，A, B两组实验效果上的差异可以排除性别的影响。但是，这样可能忽略变量之间的交互作用。两个指标单独来看都是均衡的，但联合起来看就不均衡了。一个更好的办法是通过马氏距离来定义相似性：
$d(G_1, G_2) = (\bar{x_1} - \bar{x_2})^T \hat{\Sigma}^{-1} (\bar{x_1} - \bar{x_2})$
$\bar{x_1}$ , $\bar{x_2}$ 是两组样本的均值， $\hat{\Sigma}$ 是所有样本的协方差。当样本服从正态分布时，马氏距离刻画了样本分组之间的距离。

为什么要样本相似？

只有其它排除协变量对实验的影响，A, B两组实验的差异才可归因于测试元素的差异。

怎么实现样本相似？

随机化（Randomization）

将样本随机分为两组。比如，根据IP地址最后一位的奇偶性。

在样本量特别大且特征数量不是特别大时，这样做没问题。大数定律保证了各组的样本分布会收敛到总体的样本分布。 但是，当样本比较小，比如临床试验样本通常较少；或者特征数量很大，特征 $p$ 和样本 $n$ 是同一个数量级，比如个性化的推荐系统中；简单的随机化就可能出现分组后不均衡。

假设一个特征在两组中不均衡的概率为 $\gamma$ , 那么 $p$ 个特征中至少有一个特征不均衡的概率大约是： $\beta=1-(1-\gamma)^p$ 。假设 $\gamma=0.0001$ , 当 $p = 10000$ 时, 计算得到 $\beta=0.63$ , 这个概率很大了。如果两组实验有差别，就很难说明到底是测试元素的差异还是某个特征的差异。

再随机化（Rerandomization）

重复随机化过程，直到两组样本的马氏距离低于某一阈值。²

协方差适应随机化（Covariance-Adaptive Randomization）

实现方法：³

将样本随机排序，两两一组， $(x_1, x_2), (x_3, x_4), (x_5, x_6), \cdots$
for i =1 to $n / 2$ :
如果 $x_{2i}$ 在第一组 $x_{2i+1}$ 在第二组的马氏距离小于 $x_{2i}$ 在第二组, $x_{2i+1}$ 在第一组，那么以大概率将 $x_{2i}$ 分在第一组, $x_{2i+1}$ 分在第二组。反之亦然。