假设检验中的两类错误
假设检验及其两类错误是数理统计学中的名词。在进行假设检验时提出原假设和备择假设,原假设实际上是正确的,但我们做出的决定是拒绝原假设,此类错误称为第一类错误。原假设实际上是不正确的,但是我们却做出了接受原假设的决定,此类错误称为第二类错误。
假设检验中的两类错误是指在假设检验中,由于样本信息的局限性,势必会产生错误,错误无非只有两种情况,在统计学中,我们一般称为Ⅰ类错误,Ⅱ类错误。
右图是研究结论和实际情况关系的矩阵:
实际情况 | |||
H0正确 | H0错误 | ||
研究结论 | 拒绝H0 | I类错误 | 正确 |
接受H0 | 正确 | II类错误 |
第一类错误(Ⅰ类错误)也称为 α错误,是指当虚无假设(H0)正确时,而拒绝H0所犯的错误。这意味着研究者的结论并不正确,即观察到了实际上并不存在的处理效应。
可能产生原因:
1、样本中极端数值。
2、采用决策标准较宽松。
第二类错误(Ⅱ类错误)也称为β错误,是指虚无假设错误时,反而接受虚无假设的情况,即没有观察到存在的处理效应。
可能产生的原因:
1、实验设计不灵敏。
2、样本数据变异性过大。
3、处理效应本身比较小。
两类错误的关系:
1、 α+β不一定等于1。
2、在样本容量确定的情况下,α与β不能同时增加或减少。
3、统计检验力。(1-β)
危害
犯Ⅰ类错误得危害较大,由于报告了本来不存在的现象,则因此现象而衍生出的后续研究、应用的危害将是不可估量的。相对而言,Ⅱ类错误的危害则相对较小,因为研究者如果对自己的假设很有信心,可能会重新设计实验,再次来过,直到得到自己满意的结果(但是如果对本就错误的观点坚持的话,可能会演变成Ⅰ类错误)。
假设检验中的两类错误实例
以单因素方差分析为例,现在希望比较三种职业的月收入有无差异,这三类职业分别是医生、律师和软件工程师
由于在常见的研究中,我们更关心各组均数的差别,对于标准差的差别则比较忽视,因此在最初的方差分析模型中,往往将不同组的εij假设为服从相同的正态分布(就是说相同)
如果三种职业的平均收入无差异,则应当有α1=α2=α3=0,此时如果采用适当的参照水平,就有
H0:αi=0,H1:至少有一个αi≠0
假如实际上这三种职业月收入是没有差异的,但是我们研究结论是三个职业里面起码有一个和其他职业是有差异的,这就犯了第一类错误(假阳性)
假如实际上这三种职业起码有一个和其他职业是有差异的,但是我们研究结论是三个职业没有差异的,这就犯了第二类错误(假阴性)