AB Test介绍

A/B Test 介绍

AB Test属于析因实验中最简单的一种:单因子实验,即只让一个因子发生变化,其他因子保持不变。
具体而言,A/B-test是为同一个目标制定两个方案,在同一时间维度,分别让组成成分相同(相似)的用户群组随机的使用一个方案,收集各群组的用户体验数据和业务数据,最后根据显著性检验分析评估出最好版本正式采用。

所以AB Test一般包含两组试验:
实验组(Treatment):实验因子发生变化,如用了新的模型,服务端用了新的redis版本等。
对照组(Control):实验因子保持在原来的水平或者某个baseline,如用原来的模型,使用旧版本的redis等。

A/B Test 数学原理

从 A/B 测试的试验原理来看,它是统计学上假设检验(显著性检验)的一种形式。
假设检验是先对总体的参数提出某种假设,然后利用样本数据判断假设是否成立的过程。逻辑上运用反证法,统计上依据小概率思想。

  • Z检验:一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。
  • T检验:主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。

假设有来自A组和B组中的每一组的5,000个样本,其中A组为参考方案,B组为实验方案。
由于每次实验结果要么转化成功,要么失败,所以A,B的分布可看作是伯努利分布;
A ∼ B ( N , λ a ) A \sim B(N, \lambda_{a}) AB(N,λa)
B ∼ B ( N , λ b ) B \sim B(N, \lambda_{b}) BB(N,λb)
所以可以设置原假设和备择假设分别是:
H 0 : λ b − λ a ≤ 0 H_{0}: \lambda_{b}- \lambda_{a}\leq0 H

ABTest流量分发是指在进行AB测试时,将流量按照一定的规则进行分配的过程。AB测试是一种通过对比两个或多个不同版本的产品或页面,来确定哪个版本对用户更有效的方法。在AB测试中,为了确保结果的准确性和可靠性,我们需要将流量分发到不同的实验组和对照组中。 根据引用提到的水平切分方式,我们可以将流量按照一定比例分发给召回组和精排组。比如将总流量的50%分给召回组,剩下的50%流量分给精排组。这样可以在不同的实验组中进行试验,并观察试验效果。 当某个试验的指标为正向时,我们可以推广这个试验到全流量中,然后继续在该部分流量上进行其他试验。这种方式可以直观地看到定向组合流量下的试验效果,但流量利用程度可能不够高。 因此,在AB测试中,我们需要根据实际情况灵活地选择适合的流量分发方式,以提高流量的利用程度。同时,还可以参考引用提到的相关文章和论文,深入了解AB测试的流量分层分桶机制和其他技术服务,以优化AB测试的流量分发。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [ABTest流量分发和业界的一些经验](https://blog.csdn.net/Gamer_gyt/article/details/115673209)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值