1.假设检验&第一第二类错误
假设检验是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立
假设检验的基本逻辑就是:我们为了解决一个疑问,就先做一个假设,然后在这个假设的基础上推测已经发生了的事情的概率,如果这个概率低于我们设定的参考值(如0.05),则我们就拒绝假设;而如果这个概率大于0.05,则我们就没有理由来拒绝原假设。
假设检验的步骤:
- 提出原假设与备择假设
- 从所研究总体中抽取随机样本
- 构造检验统计量
- 根据显著性水平确定拒绝域临界值
- 计算检验统计量与临界值进行比较
做假设检验时会设置两个假设:
1.原假设(零假设H0) 一般是统计者想要拒绝的假设
2.备择假设(H1) 统计者想要接受的假设
我们通过样本数据判断总体参数的假设是否成立,但样本是随机抽取的,所以可能出现小概率错误,即 弃真错误 和 取伪错误
- 弃真错误(第一类错误、 α \alpha α 错误):指原假设为真,但通过样本估计总体后拒绝了原假设。该错误的概率记为 α \alpha α,这个值也是显著性水平,在假设检验前会规定该值的大小
- 取伪错误(第二类错误、 β \beta β 错误): 指原假设为假,但通过样本估计总体后接受了原假设
所提的原假设一般是想要拒绝的假设,原因即是-原假设被拒绝出错的话只会犯弃真错误,而该错误的概率已经被规定的显著性水平控制,这样可以将错误影响降到最小
显著性水平是什么呢?
显著性水平—原假设实际正确时,检验统计量落在拒绝域的概率,即犯弃真错误的概率,该值一般根据业务制定
显著性水平越小,犯第一类错误的概率越小,一般取:0.01;0.05;0.1
拒绝域:
由显著性水平构成的区域,其主要用来判断假检验是否拒绝原假设,若样本的检验统计量值落在拒绝域就拒绝原假设,否则不拒绝原假设。
双侧检验拒绝域:
左侧检验拒绝域:
右侧检验拒绝域:
ref:https://zhuanlan.zhihu.com/p/86178674