假设检验与两类错误

一. 假设检验的定义
1. 什么是假设检验

首先从一个例子引出假设检验的思想

假如一个盒子装了红白球共100个,张三说里面有99个是白球,现在从盒子中任取一球,结果取出的是红球,问张三的说法对吗?

对于这个问题,我们可以采取如下的思路来解决,先假定张三说的对,那么取出红球的概率 p ( 红球 ) = 1 / 100 p(红球)=1/100 p(红球)=1/100,也就是一次抽样取出红球是小概率事件,但现在一次抽样抽出红球,与小概率事件实际不符,所以我们认为原来的假定为假,这个盒子中不可能有99个白球。

假设检验先假设总体具有某种特征,例如总体的参数为多少,然后再通过对样本的加工,即构造统计量,推断出假设的结论是否合理。

假设检验依据的是小概率思想,即小概率事件在一次试验中基本上不会发生。

2. 假设检验的步骤

下面以一个案例来说明假设检验的步骤,假设某车间用一台包装机包装葡萄糖。已知每袋糖的净重是一个随机变量,且服从标准差为 0.015 kg 的正态分布。某日随机抽取它所包装的9袋糖,称得净重为(kg):
0.497 , 0.506 , 0.518 , 0.524 , 0.498 , 0.511 , 0.520 , 0.515 , 0.512 0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512 0.4970.5060.5180.5240.4980.5110.5200.5150.512
问每袋糖的净重的均值 μ \mu μ是不是0.5kg?

  1. 提出原假设与备择假设
    本例中原假设和备择假设分别为: H 0 : μ = 0.5 k g H_0: \mu = 0.5 kg H0:μ=0.5kg H 1 ≠ 0.5 k g H_1 \neq0.5kg H1=0.5kg

  2. 从所研究总体中出抽取一个随机样本
    本例中从总体中随机抽取了9个样本,通过经验我们知道样本的均值 X ‾ \overline{X} X与总体的均值 μ \mu μ的差值不会太大,如果相差太大,我们就可以拒绝原假设 H 0 H_0 H0

  3. 构造检验统计量
    统计量 Z = X ‾ − μ δ / n Z = \frac{\overline{X} - \mu}{\delta/\sqrt{n}} Z=δ/n Xμ(其中 δ \delta δ为总体标准差, n n n为样本数量)服从标准正太分布。

  4. 根据显著性水平确定拒绝域临界值
    在这里插入图片描述
    选择一个阈值 k k k,根据标准正太分布的性质,当 Z > k Z > k Z>k Z < − k Z < -k Z<k时,拒绝原假设 H 0 H_0 H0,当 − k < = Z < = k -k <= Z <= k k<=Z<=k时不拒绝原假设 H 0 H_0 H0

    一般阈值的选择是由统计量落在拒绝域的概率确定,它叫做置信水平,用 α \alpha α表示,一般取值为 5 % 5\% 5%

  5. 计算检验统计量与临界值进行比较
    根据抽样的样本,计算出统计量 Z = ( 0.497 + 0.506 + 0.518 + 0.524 + 0.498 + 0.511 + 0.520 + 0.515 + 0.512 ) / 9 − 0.5 0.015 / 3 = 2.24 Z = \frac{( 0.497+0.506+0.518 +0.524+0.498+0.511+0.520+0.515+0.512) / 9 - 0.5}{0.015 / 3} = 2.24 Z=0.015/3(0.497+0.506+0.518+0.524+0.498+0.511+0.520+0.515+0.512)/90.5=2.24
    根据 5 % 5\% 5%的置信水平计算出两端的阈值分别是 − 1.96 -1.96 1.96 1.96 1.96 1.96,因为 Z > 1.96 Z > 1.96 Z>1.96,所以在置信度水平 5 % 5\% 5%的情况下,拒绝原假设 H 0 H_0 H0,即总体样本的均值不等于 0.5 k g 0.5kg 0.5kg

二. 假设检验的相关概念
1. 假设检验的两类错误
拒绝 H 0 H_0 H0不拒绝 H 0 H_0 H0
H 0 H_0 H0为真第一类错误( α \alpha α)正确( 1 − α 1-\alpha 1α)
H 0 H_0 H0为假正确( p o w e r = 1 − β power=1-\beta power=1β)第二类错误( β \beta β)

第一类错误:原假设为真,但我们却拒绝了它,对应假设检验的显著性水平,一般用 α \alpha α表示。

第二类错误:原假设为假,但我们却没有拒绝它,一般用 β \beta β表示。

功效:当原假设为假,我们正确拒绝原假设的概率,它等于 1 − β 1 - \beta 1β

p值:当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率,如果 p < α p < \alpha p<α表明原假设发生的概率很小,但却发生了, 根据小概率事件,那么拒绝 H 0 H_0 H0,如果 p > = α p >= \alpha p>=α表明原假设发生的概率较大,那么不能拒绝 H 0 H_0 H0

2. 两类错误的计算

假如有如下假设检验,原假设 H 0 : μ = 0 H_0: \mu = 0 H0:μ=0,备择假设 H 1 : μ = 10 H_1: \mu = 10 H1:μ=10,下图所示,该假设检验的置信水平 α \alpha α为红色横线填充的部分,功效 β \beta β为蓝色斜线填充的部分。
在这里插入图片描述

下面用代码演示下两类错误的计算:

from scipy.stats import norm

if __name__ == '__main__':
    alpha = 0.05
    rv = norm(loc=0, scale=10)
    zright = rv.ppf(1 - alpha)

    power = 1 - norm(loc = 10, scale = 10).cdf(zright)
    beta = 1 - power

    print("power = {:.2f}, beta = {:.2f}".format(power,beta))

运行结果:

power = 0.26, beta = 0.74

  • 8
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值