第一型错误与第二型错误( I 型错误 II 型错误)

 

简介

我们不妨先看下定义:

第一类错误:原假设是正确的,却拒绝了原假设。
第二类错误:原假设是错误的,却没有拒绝原假设。

第一类错误即 I 型错误是指拒绝了实际上成立的H0,为“弃真”的错误,其概率通常用α表示,这称为显著性水平。α可取单侧也可取双侧,可以根据需要确定α的大小,一般规定α=0.05或α=0.01。
第二类错误即 II 型错误是指不拒绝实际上不成立的H0,为“存伪”的错误,其概率通常用β表示。β只能取单尾,假设检验时一般不知道β的值,在一定条件下(如已知两总体的差值δ、样本含量n和检验水准α)可以测算出来。

来自:传送门

我们知道,一型错误往往利用 α分位数进行假设推断,而二型错误我们则用 β 值进行衡量

一,二型错误之间的联系

对于实际情况来说,我们可以看到预测情况与真实情况之间的数量关系,即混淆矩阵:

 

 

我们假设有原假设H0和备择假设H1,那么利用自己的data构造统计量,即构造某种满足H0的统计量分布;同样的我们也可以构造某种满足H1的统计量分布:

 


其中虚线表示分位数 α , 黑色曲线表示H0统计量分布,红色曲线表示H1统计量分布
这样一来,H0极端情况(小概率事件)为虚线右侧与黑色分布曲线相围成的面积,并且定义为FP(α);对于H1极端情况(小概率事件)为虚线左侧与红色分布曲线相围成的面积,并且定义为FN(β)

那么倘若我们想降低一型错误发生率,即将虚线往右移动,那么势必会增大二型错误发生率;同样,我们想降低二型错误发生率,即将虚线往右移动,那么势必会增大一型错误发生率
唯一降低两型错误发生率的办法是提高样本量,使得二者分母都变大

拓展

我们往往在做统计推断的时候只考虑一型错误发生情况(即 α 分位数),那是因为我们往往围绕H0构造统计量(比较好构造);而H1的统计量分布往往不太好求,并且二型错误发生情况必须知道H1的统计量分布才能求出,所以我们一般做简单的统计推断时不考虑二型错误

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangchuang2017

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值