公众号后台回复“图书“,了解更多号主新书内容
作者:livan
来源:数据python与算法
前沿
如下图所示,样本显著性的计算是在试验结尾部分的重要步骤,决定了试验是否有效:
A-A-B三组数据观察n天后,会产生3组数据,我们接下来的任务就是计算这三组数据的统计效果,进而确定哪个方案效果好……
并不是所有的试验都能够达到最小样本量,在不能获取到最小样本量的时候,我们可以采用简化的方式,直接计算卡方值。
卡方检验计算
前面讲到的假设检验都是参数类的假设检验,另外对于非参数假设检验就不合适了,接下来我们介绍一下非参数假设检验——卡方检验。
卡方检验也是依据假设检验来完成的,看一下具体的公式:
首先:计算自由度
R是行数,即有多少个方案;C是列数,即有多少个比较指标。
其次:计算卡方统计量
P为各方案发生的概率,n为样本的总数。
通过频数计算,也可以获取到fe
试验之后的频数表为:
计算卡方值为:
比较计算的卡方值与标准值的大小,如果卡方值>标准值,则两个方案有显著性差异,反之则反之。
通过一个案例来讲解卡方检验在AB测试中的应用:
比较一个试验点击率是否有显著性变化,在样本统计量不大的情况下,无法满足最小样本量,因此采用卡方检验,方案结论如下表:
理论假设是两个方案之间没有差异,即各个方案点击占比与合计占比一致,所以第一行第一列的理论频数为:
其他单元频数以此类推。
得到理论值后,可以计算卡方值为:
同时,在df=1和α=0.05约束下,标准卡方值为3.84。
拿此卡方值与标准卡方值比较:1.54<3.84,则两个方案没有显著性差。
欢迎大家关注公众号:
◆ ◆ ◆ ◆ ◆
当当网开学季活动来袭,满100减50的基础上,实付满200的基础上使用优惠码DYU6NM可以再减40,相当于400-240,
使用方法如下:
步骤一,挑选心仪的图书至购物车点击结算
步骤二,点击优惠券/码处
步骤三,输入优惠码DYU6NM (注意全部要大写)
需要注意的是:优惠码全场自营图书可用(教材、考试类除外)
更多详情可以扫描下方二维码或点击小程序:
点击阅读原文,即可参与当当400-240购书活动