假设检验_笔记|关于假设检验的一些内容

本文探讨了假设检验在样本推断总体中的作用,强调了检验的目的在于分析样本与总体指标间是否存在显著差异。通过举例解释了如何在正态分布背景下进行假设检验,涉及拒绝域的概念,并对比了不同拒绝域大小对检验结果的影响。文章还提到了区间估计与假设检验的关联,并指出在某些情况下,将标准正态分布转换回原分布有助于理解结果的物理意义。
摘要由CSDN通过智能技术生成

之前的t分布、正态分布等内容,都是样本推断总体的方法。

用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和证实。

通过检验,对样本指标假设的总体指标之间是否存在差别作出判断:是否接受原假设

这里必须明确,进行检验的目的不是怀疑样本指标本身是否计算正确,而是为了分析样本指标和总体指标之间是否存在显著差异

从这个意义上,假设检验又称为显著性检验

所有的假设检验都是建立在原假设基础之上,对原假设进行的推论进行检验

PPT上的一个例子:

一个工厂,生产包装,标准的质量应该是0.5kg。所生产的包装的质量服从正态分布。工作人员采集了9个样本,平均值是0.5090kg,样本方差是0.015^2.那么,需要我们推断一下,这个机器工作的是否正常或者说合格?

其实问题在于,用上述样本估计出的总体特征值(也即是包装质量的总体平均值)是不是接近0.5kg?

这里就又衍生出一个问题,接近0.5kg到底是什么意思?

d092bb7e4d36f547ebd96f940774493f.png

我们可以设定一个范围,认为在0.5左右的一个区间中,可以认为是接近0.5kg的。

说白了还是区间估计,还是要用之前说的正态分布(或t分布等)去做。

假设,我们认为,样本均值只要在0.5kg左右95%的概率区间出现,那么就说明0.5kg是对的。

293c50da6b5c8b5492e48645c08af7c9.png

由于质量其实是满足正态分布的(其他的情况下可能是t分布或者其他什么分布,看具体的场景和要求),所以可以进一步把问题转化为标准正态分布下的95%置信区间求解问题

8aedbad44a291acc0dc229c85b5a7dae.png

0左右的95%就是非拒绝域,95%再往外的,就是拒绝域。

插一句:

这里之所以叫拒绝域,是因为,拒绝可以很简单,接受却很难。

只要有证据证明均值落在了拒绝域里,就可以轻松拒绝,不留责任;

但是即使落在非拒绝域里很多次,也不能说就接受了假设。

因为原假设本身是个大概率事件,拒绝原假设却是个小概率事件。小概率事件竟然都发生了,说明这个事情真的不靠谱,所以要拒绝它。但是大概率事件本身很容易发生,做了一些实验,没有发现它掉到拒绝域,也只是说没有足够的证据证明它错,并不能证明它对

拒绝就直接拒绝,接受却是畏畏缩缩、姑且接受。

和司法判决类似,有罪就需要强有力的证据证明,原告需要有足够的证据证明被告有罪,被告并不需要证明自己无罪。如果原告证明不了被告有罪,那就疑罪从无。

回归正文:

由于此处仍然是:所有的假设检验都是建立在原假设基础之上,对原假设进行的推论进行检验

所以可以认为u0=0.5,然后把原来服从正态分布的X转化为标准的正态分布,也即:

0f9f4b780c1ddc49962d404a2d2b2c86.png

算出来,0.5090kg对应标准正态分布的点是1.8

其中,1.8就在标准正态分布概率密度图中找就行,同时也找到你的拒绝域临界点上下限(也可能只有上限或下限)

这里考虑2种情况。

情况1:我们要求,拒绝域有10%,双边检验;

拒绝域比较大,就是说,更容易拒绝原假设,所以对原假设的要求就更加严格。

情况2:我们要求,拒绝域只有5%,双边检验。

拒绝域比较小,不容易拒绝原假设,对原假设的要求比较宽松。

先考虑情况1:

正态分布,双边检验10%,则左右各5%,查正态分布表对应的上下限临界值就是1.645和-1.645

c932e724b44326cae0a7161c2493c933.png

在这种比较严格的条件下(拒绝域比较大),就不接受原假设,认为H0不成立,H1备择假设成立。

再考虑情况2:

左右各2.5%,查表得到对应的上下限临界值为1.96和-1.96

90b12f6dd3c957a3d22dc685568ba563.png

在这种比较宽松的条件下(拒绝域比较小),特征值掉在了区间范围内,不拒绝原假设H0。

所以实际上假设检验还是区间估计。

以上过程实际上就是把u0就当成实际的u,然后把原分布(正态分布)转化到标准正态分布去看。

也可以像PPT里那样将标准正态分布转化到原分布去看,比如下面的过程。这样的好处是算出来的结果具有物理意义,比如下面的结果就告诉我们在0.4902kg~0.5098kg之间都是可以不拒绝的。

只算情况2:

6ff75202af3df94b77958560d0d15b59.png

再考虑几个例子就结束。

c9dda624ed7bd7748b0d7b8a212d4f4c.png

先做的1、3题,再做的2题,顺序2、3题搞反了,这也是PPT上的题。

79db0a39df2826df3be8ae2c6b850e28.png

a323171ab0388195d9ac478d22db307b.png

cdea0e47f5830292c3da23ef1a3090f8.png

用x的分布、z的分布、p值都可以判断是否拒绝。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值