ABtest依据:假设检验

相关名词:弃真错误、取伪错误 ,原假设、备择假设,双侧检验、左侧检验、右侧检验,统计量:Z统计量、T统计量,拒绝域、接受域,显著水平

背景:

        一般假设检验用在实际工作中是在做AB实验时,用于确定一个新的策略、产品是否优于之前,因为对比新旧策略不可能把所有的目标用户都计算一下相关指标,比较优劣。一般是进行抽样,保证各方面条件一致的情况下,二者差异的地方只有策略不同。

举个例子,我想要对比新旧策略A、B的效果,一般会有2种假设:

原假设:A < B ; 备择假设: A > B

通常会把希望的结果放在备择假设,即新策略优于旧策略,这是因为通过抽样数据来判断假设是否成立,可能会犯弃真错误(也叫第I类错误、\alpha错误,这个值也是显著性水平,在假设检验之前我们会规定这个概率的大小)或取伪错误(第II类错误、\beta错误),弃真错误的概率会被限制,一般是0.05,此时错误的概率值是可控的,因此一般会把想要拒绝的假设放在原假设。

显著水平:是指当原假设实际上正确时,检验统计量落在拒绝域的概率,简单理解就是犯弃真错误的概率

检验方式:

检验方式分为两种:双侧检验和单侧检验,单侧检验又分为两种:左侧检验和右侧检验。

双侧检验:备择假设没有特定的方向性,形式为“≠”这种检验假设称为双侧检验。

单侧检验:备择假设带有特定的方向性 形式为">""<"的假设检验,称为单侧检验, "<"称为左侧检验, ">"称为右侧检验。

检验统计量:据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。

拒绝域:由显著性水平围成的区域

拒绝域的功能主要用来判断假设检验是否拒绝原假设的。如果样本观测计算出来的检验统计量的具体数值落在拒绝域内,就拒绝原假设,否则不拒绝原假设。给定显著性水平α后,查表就可以得到具体临界值,将检验统计量与临界值进行比较,判断是否拒绝原假设。

 

 

 

假设检验步骤

  • 提出原假设与备择假设
  • 从所研究总体中出抽取一个随机样本
  • 构造检验统计量
  • 根据显著性水平确定拒绝域临界值
  • 计算检验统计量与临界值进行比较

两种假设检验

假设检验根据业务数据分为两种:一个总体参数的假设检验和两个总体参数的假设检验

一个总体参数的假设检验时A>0.5这种,两个总体参数是A>B这种

统计量的选择

一般当样本量大于30时,称为大样本,根据中心极限定理,样本的分布趋于正态分布

 

 

参考资料:

假设检验——这一篇文章就够了 - 知乎

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值