如何理解α、β一类错误和二类错误?

本文介绍了统计假设检验中的关键概念,如原假设和备择假设,以及显著性水平和置信水平的重要性。通过ABTest的例子,阐述了一类错误(误判无效为有效)和二类错误(误判有效为无效)在业务决策中的影响,强调了控制一类错误的必要性。
摘要由CSDN通过智能技术生成

原假设 H0:一般是想要推翻的结论,如指标没有变化,实验组和对照组的该结果指标没有差异等。

备择假设 H1:一般是想要证明的结论,如实验组的指标是显著提升的,指标提升10%等。

弃真错误/一类错误/显著性水平 α:表示原假设H0为真时,但拒绝原假设的概率;通常取α=0.05或α=0.01。

置信水平 1-α:表示区间估计的可靠性。

取伪错误/二类错误 β:接受错误原假设的概率。

统计检验效力 1-β:当H0为假时,能够准确得出“拒绝H0”这个正确结论的概率,所以也称为检验效力。

概率

含义

结果

α

拒绝正确原假设的概率

×

1-α

接受正确原假设的概率

1-β

拒绝错误原假设的概率

β

接受错误原假设的概率

×


实例:

做了一个ABTest判断新功能上线判断效果:H0没有效果,H1有效果。

业务上的一类错误和二类错误:

一类错误:功能的改动并没有效果,但我们误认为有效果;(假设功能确实没有效果,原假设H0是成立的,但错误地认为有效果,就把功能上线了,则犯了弃真错误)。

二类错误:功能的改动有效果,但我们误认为没有效果;(假设功能有效果,则原假设H0是错误的,本应该被推翻的,但却接受了原假设,则犯了取伪错误)。

通常第一类错误更不能接受,因为宁愿砍掉几个好的策略,也不能让一个不好的策略上线。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值