假设检验原理
- 基础:小概率原理,即一般认为小概率事件在一次随机抽样中不会发生。
- 基本思想:先建立一个关于样本所属总体的假设,考察在假设条件下随机样本的特征信息是否属小概率事件,若为小概率事件,则怀疑假设成立有悖于该样本所提供特征信息,因此拒绝假设
- 事实上,小概率事件在随机抽样中还是可能发生的,只是发生的概率很小。若正好碰上了,则假设检验的结论就是错误的。当然,犯这种错误的概率很小。
假设检验过程
一、建立假设
根据统计推断的目的而提出的对总体特征的假设。统计学中的假设有两方面的内容:
- 检验假设(hypothesis to be tested),亦称原假设或无效假设(null hypothesis),记为 H 0 H_0 H0 ;
- 与H0相对立的备择假设(alternative hypothesis),记为
H
1
H_1
H1。后者的意义在于当
H
0
H_0
H0 被拒绝时供采用。两者是互斥的,非此即彼。
H 0 : μ = μ 0 , H 1 : μ ≠ μ 0 H_0:\mu=\mu_0, H1:\mu≠\mu_0 H0:μ=μ0,H1:μ̸=μ0;
H 0 : μ 0 = 7.4 , H 1 : μ 0 ≠ 7.4 H_0:\mu _0=7.4, H1:\mu _0≠7.4 H0:μ0=7.4,H1:μ0̸=7.4
二 、确定检验水准
- 实际上就是确定拒绝 H 0 H_0 H0时的最大允许误差的概率。检验水准(size of test),常用 α \alpha α 表示,是指检验假设 H 0 H_0 H0本来是成立的,而根据样本信息拒绝 H 0 H_0 H0的可能性大小的度量,换言之, α \alpha α是拒绝了实际上成立的 H 0 H_0 H0的概率。
- 常用的检验水准为 α \alpha α = 0.05,其意义是:在所设 H 0 H_0 H0的总体中随机抽得一个样本,其均数比手头样本均数更偏离总体均数的概率不超过5%
三、计算检验统计量和P值
- 实际上在此之前还有一步叫做进行试验,所需的样本数据即从此得来
- 统计量只是工具,概率值才是目的,它可以客观衡量样本对假设总体偏离程度
- 从 H 0 H_0 H0假设的总体中抽出现有样本(及更极端情况)的概率,即 P P P值
- 检验统计量的特点
- 该统计量应当服从某种已知分布,从而可以计算出 P P P值
- 各种检验方法所利用的分布及计算原理不同,从而检验统计量也不同
- 初学者往往本末倒置,很认真地在学工具,却忘记了统计学的本质是思维方式
四、得出推断结论
- 按照事先确定的检验水准 α \alpha α界定上面得到的 P P P值,并按小概率原理认定对 H 0 H_0 H0的取舍,作出推断结论
- 若P ≤ α \alpha α基于 H 0 H_0 H0假设的总体情况出现了小概率事件,则拒绝 H 0 H_0 H0,接受 H 1 H_1 H1,可以认为样本与总体的差别不仅仅是抽样误差造成的,可能存在本质上的差别,属“非偶然的(significant)”,因此,可以认为两者的差别有统计学意义。 进一步根据样本信息引申,得出实用性的结论
- 若P> α \alpha α基于 H 0 H_0 H0出现了很常见的事件
则样本与总体间的差别尚不能排除纯粹由抽样误差造成,可能的确属“偶然的(non-significant)”,故尚不能拒绝 H 0 H_0 H0
因此,认为两者的差别无统计学意义,但这并不意味着可以接受 H 0 H_0 H0。
结论不能绝对化
- 本身就保留了犯错误的可能性
- 样本量导致的检验效能问题
- 样本量太小,导致检验效能不足,从而无法检出可能存在的差异
- 样本量太大,得出的有统计学意义的结论可能根本就没有实际意义