P值、显著性水平、错误类型
P值
- 说法1:p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。
- 说法2:P值是在假设检验中用于评估数据对原假设的支持程度的指标。它表示在假设原假设为真的情况下,观察到的数据或更极端情况发生的概率。P值越小,表明观察到的数据在原假设下发生的概率越小,因此提供了拒绝原假设的证据。
如果P值小于预先设定的显著性水平(通常为0.05或0.01),则有足够的证据拒绝原假设
如果P值大于显著性水平,没有足够的证据拒绝原假设
显著性水平
显著性水平(Significance Level): 显著性水平是在假设检验中设置的一个阈值,用于决定是否拒绝原假设。通常用α表示,常见的显著性水平包括0.05和0.01。
错误类型
第一类错误
第一类错误:原假设是正确的,却拒绝了原假设。
- I型错误是指拒绝了实际上成立的H0,为“弃真”的错误,其概率通常用α表示,这称为显著性水平(significance level)。
第二类错误:原假设是错误的,却没有拒绝原假设。
- Ⅱ型错误是指不拒绝实际上不成立的H0,为“存伪”的错误,其概率通常用β表示
- 检验的势(power of the test)定义为在原假设是错误的情况下拒绝原假设的概率。检验的势等于1减去犯第二类错误的概率:power=1-P(Type II error)
- 势不仅依赖于参数真值与假设值相对差异的大小,而且依赖于样本容量。 在其他条件不变时,差异和样本容量越大,检验越有效。