B站:AB Test 知识全解

AB Test的实质:假设检验,主要有以下几个步骤:

1、在实验开始前,找产品、项目经理等确认:实验需要验证的改动点(一次只能看一个!!!)

2、数据分析师设计需要去观测的核心指标,指标分为2类:

①绝对类指标(用得比较少 ,如:DAU平均停留时长)

②比率类指标(通过多个指标计算得到,如:点击率、转化率、复购率)

3、计算实验所需的最小样本量(trade off:n越大,实验结果越可信;但n过大,会对用户造成不良影响),每一个实验组所需的样本量:[用到了“大数定律”和“中心极限定律”]

α:犯第一类错误的概率,而1-α(没有犯第一类错误的概率)是置信水平。通常取0.05。

β:犯第二类错误的概率,而1-β是统计功效。通常取0.2。

样本标准差计算方式有所不同:

①当观测指标为绝对类指标:

②当观测指标为比率类指标:

e.g. 我们希望点击率从20%提升至25%,那么PA=20%,PB=25%,5%(作差)

PS: 网络上有直接的工具可以计算!

4、结合日活量,计算实验周期

5、设计流量分割策略:对样本流量进行分流分层。(保证随机分布:避免出现辛普森悖论)

目标:正交分层,互不影响的流量分层。

①组1和组2是互斥的

②B1、B2和B3之间也相互互斥

∴对于实际业务场景,很多topic之间是没有关联的,那么便可以共用流量:

6、准备就绪后,和PM和开发同学确认开始实验。

在正式开始前,会用“小流量”去看一段时间“灰度实验”(验证改动不会造成特别“极端的影响”)

欲知后事如何,下一篇见!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值