因为不能期望点估计量能给出总体参数的精确值,故常在点估计量上加减一个边际误差来计算区间估计。
8.1 当总体标准差已知时,总体均值的区间估计
区间估计
1-α表示置信系数。
比如置信系数为0.95时,则这个区间称为95%的置信区间,有95%的把握相信区间内包含总体均值μ。或者换种说法,从区间中随机取100个数,再次组成区间,约有95个区间包含总体均值。
如果总体的分布不服从正态分布,那样本容量要尽量大。
8.2 总体均值的区间估计:σ未知的情况
更常见的情况是σ未知,用样本标准差估计总体标准差,边际误差和总体均值的区间估计都已t分布的概率分布为依据。
t分布是一类相似的概率分布组成的分布族,某个特定的t分布依赖于自由度。
随着自由度的增大,t分布和标准正态分布越来越像。
区间估计
8.3 样本容量的确定
E表示希望达到的边际误差
样本容量
8.4 总体比率
区间估计
假设检验
9.1 原假设和备择假设的建立
将研究中的假设作为备择假设,将受到挑战的假说设为原假设。
9.2 第一类错误和第二类错误
第一类错误是拒真,第二类错误是纳伪。
当原假设为真且以等式出现时犯第一类错误的概率称为检验的显著性水平,用α表示,通常取0.05或0.01。
9.3 总体均值的检验,当总体标准差已知
假设检验的步骤:先提出原假设和备择假设,指定检验中的显著性水平,收集样本数据并计算检验统计量。
此处进行的是总体均值的检验,且假定总体标准差已知,故检验统计量的计算方法为
p-值法:利用检验统计量的值计算出p值,与显著性水平进行比较,如果p-值≤α,则拒绝原假设。
临界值方法:通过显著性水平计算出临界值和拒绝法则,用检验统计量确定是否拒绝原假设。
区间估计和假设检验的关系,可以通过区间估计来进行假设检验,设置信水平为0.95,显著性水平为0.05,如果原假设中的总体均值在置信区间中,则不能拒绝原假设。
9.4 总体标准差未知时检验总体均值
检验统计量
检验统计量服从自由度为n-1的t分布。
检验步骤和上面一样。
9.5 总体比率
检验统计量服从标准正态概率分布。
9.6 假设检验与决策
前面都是控制了第一类错误,所以得出的结论是不能拒绝原假设而不是接受原假设,因为没有控制第二类错误。
9.7 计算第二类错误的概率
9.8 对总体均值进行假设检验时样本容量的确