关于AB测试的效果推论

最新推荐文章于 2023-09-13 14:34:59 发布

阿明 -李明

最新推荐文章于 2023-09-13 14:34:59 发布

阅读量688

点赞数

文章标签： ab测试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44094615/article/details/125246568

版权

现在很多AB测试的帖子很多，看起来也不错，我总结了3个事情：

1、首先测试AB测试所需要的样本量到底需要多少？

我写个简单公式，就是

比如测试数据针对风险的准确率，我发现该数据的准确率是从20%-30%，结果就是

N = 16 *( 0.2*(1-0.2) + 0.3*(1-.03)/ (0.3-0.2)^2 = 37就是需要40个样本就可以了，及时放大乘以2，也就是80个样本。

样本的准确率容许差值越大，样本数量需求越少，比如准确率是从10%-50%，那么有2个样本就够了。

2、P值0.05，对应为1.96的原理，就是所有Z值只要大于这个1.96越大越好，说明2个数组间是有差异性

3、计算Z值的方法，一般都是找2个数组，然后分别做平均值、标准差，用excel计算就行

　　

　　其中：

是样本1，样本2的平均数；
S1,S2是样本1，样本2的标准差；
n1,n2是样本1，样本2的容量。

后测	实验组	n1 = 50		S1b = 8
后测	控制组	n2 = 50		S2b = 14

　　再计算后测Z的值:

　　

∵|Z|= 2.16＞1.96

∴ 后测两组差异显著。

注意：

一般测试基本上都是基于2组数据，注意2组数据应该尽量做到样本大小一致，另外很多情况是很难做AB测试都是基于原来的一些统计值如何判断模型的有效性？

其实很简单：

就是原来的模型的精确率比如50%，你新做了一个模型的精确率是80%，那么就是

（0.8-0.5）/0.5 = 60% ,你模型比以前的模型有效性提高了60%,这个足以说明了。当时我考虑了半天AB测试看了一堆东西，后来想明白了，我只有一个结论数字，哪里做的了AB测试。

不过多看看以前的东西挺好，未来AB测试会对运营很有帮助，调整某个特征，结论不同如果来通过机器界定？

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

阿明 -李明 CSDN认证博客专家 CSDN认证企业博客

码龄6年

中金汇安（北京）科技有限公司

26: 原创

107万+: 周排名

9万+: 总排名

2万+: 访问

: 等级

296: 积分

6: 粉丝

17: 获赞

17: 评论

48: 收藏

私信

关注

热门文章

最新评论

安装tensorflow-gpu-2.6
小木_清风般的过去: 感谢博主，非常有帮助！
Unbuntu中文语言错乱问题
阿明 -李明: 继续增加输入： sudo apt install ibus sudo apt-get install ibus-pinyin 启动选择拼音作为输入： iibus-setup ibus-setup
langchain下的安装步骤GLM
阿明 -李明: 引用「conda create -n langchain-chatglm python==3.10.4」 jupyter notebook # or jupyter notebook --allow-root
关于AB测试的效果推论
阿明 -李明: # 利用python 进行AB测试检验，发现测试数据之间的关系 from scipy.stats import ttest_ind import numpy as np # n1_samples = [64.2, 28.4, 85.3, 83.1, 13.4, 56.8, 44.2] # n2_samples = [45, 29.5, 32.3, 49.3, 18.3, 34.2, 43.9] n1_samples = np.array([[1,1.2],[1.03,1.03],[1.2,1.02],[0.89,0.95],[0.92,0.89]]) n2_samples = np.array([[2,2.1],[2.13,2.53],[3.23,2.22],[1.9,2.95],[1.95,1.89]]) p1 = np.array([0.05,0.05]) p2 = np.array([0.01,0.01]) print("标准差", np.std(n1_samples)) print("标准差", np.std(n2_samples)) # 独⽴双样本 t 检验的⽬的在于判断两组样本之间是否有显著差异： # 当我们使⽤scipy.stats.ttest_ind(x, y)，我们建⽴的假设是在x.mean()-y.mean()，但常为了得到正值结果，我们常会要求x.mean()>y.mean()。 # 即放置顺序是(n1_samples, n2_samples)，⽽不是(n2_samples, n1_samples) t_val, p = ttest_ind(n1_samples, n2_samples) print('t值：',t_val," p值：", p) if (p < p2).all() : print("2个数组之间重大差异，可以视为模型对数据结果影响度非常大") elif (p < p1).all() : print("2个数组之间有差异，,可以视为模型对数据结果影响度比较大") else: print("2个数组之间没有差异")
关于AB测试的效果推论
阿明 -李明: [code=python] # 利用python 进行AB测试检验，发现测试数据之间的关系 from scipy.stats import ttest_ind import numpy as np # n1_samples = [64.2, 28.4, 85.3, 83.1, 13.4, 56.8, 44.2] # n2_samples = [45, 29.5, 32.3, 49.3, 18.3, 34.2, 43.9] n1_samples = np.array([[1,1.2],[1.03,1.03],[1.2,1.02],[0.89,0.95],[0.92,0.89]]) n2_samples = np.array([[2,2.1],[2.13,2.53],[3.23,2.22],[1.9,2.95],[1.95,1.89]]) p1 = np.array([0.05,0.05]) p2 = np.array([0.01,0.01]) print("标准差", np.std(n1_samples)) print("标准差", np.std(n2_samples)) # 独⽴双样本 t 检验的⽬的在于判断两组样本之间是否有显著差异： # 当我们使⽤scipy.stats.ttest_ind(x, y)，我们建⽴的假设是在x.mean()-y.mean()，但常为了得到正值结果，我们常会要求x.mean()>y.mean()。 # 即放置顺序是(n1_samples, n2_samples)，⽽不是(n2_samples, n1_samples) t_val, p = ttest_ind(n1_samples, n2_samples) print('t值：',t_val," p值：", p) if (p < p2).all() : print("2个数组之间重大差异，可以视为模型对数据结果影响度非常大") elif (p < p1).all() : print("2个数组之间有差异，,可以视为模型对数据结果影响度比较大") else: print("2个数组之间没有差异") [/code]

最新文章

目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。