之前的t分布、正态分布等内容,都是样本推断总体的方法。
用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和证实。
通过检验,对样本指标与假设的总体指标之间是否存在差别作出判断:是否接受原假设。
这里必须明确,进行检验的目的不是怀疑样本指标本身是否计算正确,而是为了分析样本指标和总体指标之间是否存在显著差异。
从这个意义上,假设检验又称为显著性检验。
所有的假设检验都是建立在原假设基础之上,对原假设进行的推论进行检验。
PPT上的一个例子:
一个工厂,生产包装,标准的质量应该是0.5kg。所生产的包装的质量服从正态分布。工作人员采集了9个样本,平均值是0.5090kg,样本方差是0.015^2.那么,需要我们推断一下,这个机器工作的是否正常或者说合格?
其实问题在于,用上述样本估计出的总体特征值(也即是包装质量的总体平均值)是不是接近0.5kg?
这里就又衍生出一个问题,接近0.5kg到底是什么意思?
我们可以设定一个范围,认为在0.5左右的一个区间中,可以认为是接近0.5kg的。
说白了还是区间估计,还是要用之前说的正态分布(或t分布等)去做。
假设,我们认为,样本均值只要在0.5kg左右95%的概率区间出现,那么就说明0.5kg是对的。
由于质量其实是满足正态分布的(其他的情况下可能是t分布或者其他什么分布,看具体的场景和要求),所以可以进一步把问题转化为标准正态分布下的95%置信区间求解问题。
0左右的95%就是非拒绝域,95%再往外的,就是拒绝域。
插一句:
这里之所以叫拒绝域,是因为,拒绝可以很简单,接受却很难。
只要有证据证明均值落在了拒绝域里,就可以轻松拒绝,不留责任;
但是即使落在非拒绝域里很多次,也不能说就接受了假设。
因为原假设本身是个大概率事件,拒绝原假设却是个小概率事件。小概率事件竟然都发生了,说明这个事情真的不靠谱,所以要拒绝它。但是大概率事件本身很容易发生,做了一些实验,没有发现它掉到拒绝域,也只是说没有足够的证据证明它错,并不能证明它对。
拒绝就直接拒绝,接受却是畏畏缩缩、姑且接受。
和司法判决类似,有罪就需要强有力的证据证明,原告需要有足够的证据证明被告有罪,被告并不需要证明自己无罪。如果原告证明不了被告有罪,那就疑罪从无。
回归正文:
由于此处仍然是:所有的假设检验都是建立在原假设基础之上,对原假设进行的推论进行检验。
所以可以认为u0=0.5,然后把原来服从正态分布的X转化为标准的正态分布,也即:
算出来,0.5090kg对应标准正态分布的点是1.8
其中,1.8就在标准正态分布概率密度图中找就行,同时也找到你的拒绝域临界点上下限(也可能只有上限或下限)
这里考虑2种情况。
情况1:我们要求,拒绝域有10%,双边检验;
拒绝域比较大,就是说,更容易拒绝原假设,所以对原假设的要求就更加严格。
情况2:我们要求,拒绝域只有5%,双边检验。
拒绝域比较小,不容易拒绝原假设,对原假设的要求比较宽松。
先考虑情况1:
正态分布,双边检验10%,则左右各5%,查正态分布表对应的上下限临界值就是1.645和-1.645
在这种比较严格的条件下(拒绝域比较大),就不接受原假设,认为H0不成立,H1备择假设成立。
再考虑情况2:
左右各2.5%,查表得到对应的上下限临界值为1.96和-1.96
在这种比较宽松的条件下(拒绝域比较小),特征值掉在了区间范围内,不拒绝原假设H0。
所以实际上假设检验还是区间估计。
以上过程实际上就是把u0就当成实际的u,然后把原分布(正态分布)转化到标准正态分布去看。
也可以像PPT里那样将标准正态分布转化到原分布去看,比如下面的过程。这样的好处是算出来的结果具有物理意义,比如下面的结果就告诉我们在0.4902kg~0.5098kg之间都是可以不拒绝的。
只算情况2:
再考虑几个例子就结束。
先做的1、3题,再做的2题,顺序2、3题搞反了,这也是PPT上的题。
用x的分布、z的分布、p值都可以判断是否拒绝。