#数据分析知识点--假设检验&第一二类错误

1.假设检验&第一第二类错误
假设检验是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立

假设检验的基本逻辑就是:我们为了解决一个疑问,就先做一个假设,然后在这个假设的基础上推测已经发生了的事情的概率,如果这个概率低于我们设定的参考值(如0.05),则我们就拒绝假设;而如果这个概率大于0.05,则我们就没有理由来拒绝原假设。

假设检验的步骤:

  • 提出原假设与备择假设
  • 从所研究总体中抽取随机样本
  • 构造检验统计量
  • 根据显著性水平确定拒绝域临界值
  • 计算检验统计量与临界值进行比较

做假设检验时会设置两个假设:
1.原假设(零假设H0) 一般是统计者想要拒绝的假设
2.备择假设(H1) 统计者想要接受的假设

我们通过样本数据判断总体参数的假设是否成立,但样本是随机抽取的,所以可能出现小概率错误,即 弃真错误 和 取伪错误

  • 弃真错误(第一类错误、 α \alpha α 错误):指原假设为真,但通过样本估计总体后拒绝了原假设。该错误的概率记为 α \alpha α,这个值也是显著性水平,在假设检验前会规定该值的大小
  • 取伪错误(第二类错误、 β \beta β 错误): 指原假设为假,但通过样本估计总体后接受了原假设

所提的原假设一般是想要拒绝的假设,原因即是-原假设被拒绝出错的话只会犯弃真错误,而该错误的概率已经被规定的显著性水平控制,这样可以将错误影响降到最小

显著性水平是什么呢?
显著性水平—原假设实际正确时,检验统计量落在拒绝域的概率,即犯弃真错误的概率,该值一般根据业务制定
显著性水平越小,犯第一类错误的概率越小,一般取:0.01;0.05;0.1

拒绝域:

由显著性水平构成的区域,其主要用来判断假检验是否拒绝原假设,若样本的检验统计量值落在拒绝域就拒绝原假设,否则不拒绝原假设。
双侧检验拒绝域:
在这里插入图片描述
左侧检验拒绝域:
在这里插入图片描述
右侧检验拒绝域:
在这里插入图片描述

ref:https://zhuanlan.zhihu.com/p/86178674

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值