AB实验样本量确定

最新推荐文章于 2024-06-01 16:37:24 发布

茵茵的聪聪

最新推荐文章于 2024-06-01 16:37:24 发布

阅读量1.3w

点赞数 11

分类专栏：数据分析文章标签： AB实验样本量确定统计功效数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36153312/article/details/103934411

版权

文章目录

在数据分析过程中， 一个完整的闭环是从数据中得到洞察，根据洞察得到某种假设，通过实验检验这一假设。

AB实验实际上是在做一个假设检验，可以参考上一篇笔记【概率论】- (2)假设检验。在查资料的过程中，查到AB实验主要有两种检验方式（不同的样本量，不同的检验方式）——

Z检验，即检验实验组与对照组服从分布的均值是否相等
卡方检验，即检验实验组是否服从理论分布（将对照组看成理论分布）

这里以Z检验为例，介绍如何确定AB实验中实验组与对照组的样本量，提供相应的代码，卡方检验原理相似。

1. 统计功效与关键概念

在假设检验中有以下两类错误——

弃真：原假设为真，而我们拒绝原假设，这种错误称为一型错误
取伪：原假设为假，而我们接受原假设，这种错误称为二型错误

在教科书中一般只限定显著性水平为 $\alpha$ ，即只考虑一型错误的概率，而不考虑二型错误。但在实际应用中（如AB实验），二型错误也必须限定在较低的范围内。如下例子，这种情况下即使 $\alpha$ 足够小，实验结果仍不够具有说服性。

假设实验的显著性水平 $\alpha=0.01$ ，二型错误概率 $\beta=0.5$ ，这意味着——

若原假设为真，我们判断出错（即拒绝）的概率为1%；

若原假设为假，我们判断出错（即接受）的概率为50%。

上面说的考虑二型错误，更常见的是考虑统计功效Statistical Power。

统计功效是指当原假设为假，拒绝原假设的概率。因此有 $1-\beta$ 。

通过求解统计功效，即可得到统计功效与 $\alpha、n$ 的关系式。反过来，知道 $\alpha、power$ 后就可以求出所需的样本量。

2. Z检验样本量确定

2.1 统计功效公式推导

原假设与备择假设如下：

$H_0:\mu_A=\mu_B \\ H_1:\mu_A \ne\mu_B\tag{1}$

令 $\delta=\mu_A-\mu_B$ ，按照二型错误的概念，假设 $\sigma_A=\sigma_B=\sigma$ ，有

最低0.47元/天解锁文章

茵茵的聪聪

关注

11
点赞
踩
93

收藏

觉得还不错? 一键收藏
3
评论
AB实验样本量确定

文章目录1. 统计功效与关键概念2. Z检验样本量确定2.1 统计功效公式推导2.2 样本量计算公式2.3 求解样本量3. 卡方检验样本量确定3.1 求解样本量4. 简要总结Reference在数据分析过程中，一个完整的闭环是从数据中得到洞察，根据洞察得到某种假设，通过实验检验这一假设。AB实验实际上是在做一个假设检验，可以参考上一篇笔记【概率论】- (2)假设检验，在查资料的过程中，主要有两...
复制链接

扫一扫

专栏目录

茵茵的聪聪 CSDN认证博客专家 CSDN认证企业博客

码龄8年

79: 原创

5万+: 周排名

76万+: 总排名

15万+: 访问

: 等级

2031: 积分

87: 粉丝

115: 获赞

8: 评论

645: 收藏

私信

关注

分类专栏

最新评论

Hadoop学习——(5) MapReduce实现PageRank
JackHui007: PageCount写法： public enum PageCouter { TotalPage, ConvergePage }
Hadoop学习——(5) MapReduce实现PageRank
七哥女友: 您好，请问PageCouter类怎么写的
因果推断——简介
c++的永恒花园: 谢谢大佬救我狗命
Spark2.X学习(1) - 结构化API概述（DataFrame与DataSet）
我姓万，家财万贯的万: 基于Spark2.x机器学习十大案例全方位剖析下载地址：https://pan.baidu.com/s/1yGkiejLXgauw0spujeSeRw 提取码: 2bx5
AB实验样本量确定
weixin_40591156: 上述z test计算的方差的有误，不应该直接是1，而是σ=ptest(1−ptest)+pcontrol(1−pcontrol)=0.45*0.55+0.4*0.6=0.4875，最终计算的样本量为1533,和卡方检验计算的差不多

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。