假设检验的定义:
假设检验是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立
假设检验的假设:
由定义可知,我们需要对结果进行假设,然后拿样本数据去验证这个假设。
所以做假设检验时会设置两个假设:
一种叫原假设,也叫零假设,用H0表示。原假设一般是统计者想要推翻的假设。原假设的设置一般为:等于=、大于等于>=、小于等于<=。
另外一种叫备择假设,用H1表示。备则假设是统计者想要接受的假设。备择假设的设置一般为:不等于、大于>、小于<。
例子在进行假设检验时,我们希望接受版本2的假设,想拒绝接受版本1的假设。所以我们的假设设置为:H0 :μ版本1 >= μ版本2 ,H1 : μ版本1 < μ版本2。
为什么统计者想要拒绝的假设放在原假设呢?因为原假设备被拒绝如果出错的话,只能犯第I类错误,而犯第I类错误的概率已经被规定的显著性水平所控制。有点看不懂哈?没关系我们讲一下假设检验中的两种错误和显著性水平就清楚了。
弃真错误、取伪错误
我们通过样本数据来判断总体参数的假设是否成立,但样本时随机的,因而有可能出现小概率的错误。这种错误分两种,一种是弃真错误,另一种是取伪错误。
弃真错误也叫第I类错误或α错误:它是指 原假设实际上是真的,但通过样本估计总体后,拒绝了原假设。明显这是错误的,我们拒绝了真实的原假设,所以叫弃真错误,这个错误的概率我们记为α。这个值也是显著性水平,在假设检验之前我们会规定这个概率的大小。
取伪错误也叫第II类错误或β错误:它是指 原假设实际上假的,但通过样本估计总体后,接受了原假设。明显者是错误的,我们接受的原假设实际上是假的,所以叫取伪错误,这个错误的概率我们记为β。
现在清楚原假设一般都是想要拒绝的假设了么?因为原假设备被拒绝,如果出错的话,只能犯弃真错误,而犯弃真错误的概率已经被规定的显著性水平所控制了。这样对统计者来说更容易控制,将错误影响降到最小。
构建检验统计量
常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法等。同样地,检验统计量也有Z检验统计量,t检验统计量,χ2检验统计量、F检验统计量。
我们需要根据总体标准差是否已知选择构建的统计量。
Z检验统计量:当总体标准差σ已知时对总体均值进行假设检验,选择标准正态随机变量z作为检验统计量,计算公式为:,其中为样本均值,为总体均值,n为样本量。
T检验统计量:当总体标准差σ未知时,检验统计量的抽样分布是t分布。检验统计量服从自由度为n-1的t分布,公式为,其中s为样本标准差。
对于T检验的解释:
{
T检验
Z检验虽然能够进行均值差异性检验,但是,它要求总体标准差已知或者样本容量足够大,这是很难做到甚至无法达成的。这时候t检验就粉墨登场了,只需从正态总体中抽取小规模的样本数据,并计算均值与标准差,用来代替正态总体的均值和标准差即可
}
下篇:
- 中心极限定理
- 样本量的选择