假设是对总体参数(如总体成数p或总体均值)的陈述
假设检验是用于检验有关总体参数的陈述是否正确的标准过程
原假设和备择假设:
原假设()是假设检验最初的假设。对于本章中的假设检验,原假设总是为总体参数声明一个
其体数值,因此可以得到一个等式形式
(原假设):总体参数=陈述值
备择假设()刚声明总体参数为完全不同于原假设陈述的数值,它可有以下三种形式:
(左侧):总体参数<陈述值
(右侧):总体参数≥陈述值
(从侧):总体参数≠陈述值
假设检验的两种可能结果:
拒绝原假设,这种情况下我们有证据支持各择假设。
不拒绝原假设,这种情况下我们没有足够的证据支持各择假设
基于统计显著性水平的假设检验决定:
我们通过将实际的样本统计量(均值或者比例)与假设原假设正确所期望的结果作比较来决定假设检验的结果。为了做出决定,必须选择一个显著性水平
- 如果得到样本统计量的概率小于1%(或者0.01),那么检验在0.01水平上是统计显著的,这为拒绝原假设提供了充分的理由
- 如果得到样本统计量的概率小5%(或者0.05),那么检验在0.05水平上是统计显著的,这为拒绝原假设提供了中等强度的证据
- 如果得到样本统计量的概率高干所选择的显著性水乎(0.01或者0.05),那么我们无法拒绝原假设a
基于P值的假设检验决定:
在对总体参数的声明进行假设检验的过程中,P值(概率数值)是指假定原假设正咖的前提下,随机抽取样本的样本统计量或更极端的样本统计量出现的概率。
- 一个小的P值(如小于或等于0.05)表明样本结果是不可能偶然发生的,因此样本结果提供足够的理由来拒绝原假设
- 一个大的P值(如大于0.05)表明样本结果可以很轻易地偶然发生,所以不能拒绝原假设。
假设检验的步骤:
- 详细阐述原假设和备择假设,每一个假设都必须对总体参数进行声明,如总体均值()或者总体成数(p),并确保要在取得样本或者收集数据之前确定。根据备择假设的形式,决定是需要左侧、右侧还是双侧的假设检验。
- 从总体中取得一个样本,并测量样本统计量,包括样本容量(n)和相关的样本统计量,如样本均值(x-)或样本成数(p^)。
- 在假定原假设正确的条件下,确定观测的样本统计量(均值或比例)或更极端的值岀现的概率。观测的准确概率就是样本结果的尸值(概率数值)
- 根据选择的显著性水平(通常是0.05或0.01,但有时也会用到其他显著性水平),决定是拒绝原假设还是不拒绝原假设。
再次强调,一定要避免混淆字母p的三种不同用法:
小写字母p代表总体成数,即在一个完整总体中的真实比例。
小写字母庐代表样本成数,即从总体中抽取的样本的比例
大写的P表示概率,即P值。
假设检验中计算样本均值的标准分数:
n= 样本容量
= 均值
= 总体标准差
=总体均值
样本均值分布标准差 = 总体标准差 / 根号n
样本均值的标准分数 = z = (样本均值 - 总体均值)/ 样本均值分布标准差
单侧假设检验的统计显著的判定:
标准分数z和在某一给定显著水平下样本均值的临界值进行比较来决定是否拒绝原假设
双侧检验(H2:μ≠陈述值)
统计显教性:如果样本均值的标准分数不大于临界值-1.96或者不小于临界值1.96那么双侧检验在0.05水平是显著的。对于001显著性水平,临界值是-2.575和2.575
p值:先在检验是单侧的假设下用样本均值的标准分数找出P值,然后乘以2就是双侧检验的P值。
和的决策表
项目 | 事实 | ||
是真的 | 是真的 | ||
决策 | 拒绝 | 第一类错误 | 决策正确 |
不拒绝 | 决策正确 | 第二类错误 |
如果样本结果接近抽样分布的峰值,那么没有理由认为原假设是错误的,不能拒绝原假设
如果样本结果远离抽样分布的峰值那么可能的解释是抽样分布的峰值不是在原假设声明的数值处达到,在这种情况下我们拒绝原假设。
假设检验中计算样本成数的标准分数:
n = 样本容量
= 样本成数
p = 总体成数
样本成数的标准分数 = z = (样本成数 - 总体成数)/ 分布标准差