假设检验与参数估计时统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同。
参数估计是在总体参数未知的前提下,通过样本统计统计量估计参数的方法,得到总体参数的一个点估计或区间估计。而假设检验是,根据以往的经验先给出总体参数值的一个假设,然后通过现有的样本信息去检验这个假设是否成立。
关于假设检验过程中的原假设、备择假设、单侧检验及双侧检验等内容都比较容易理解。这里重点讨论一下对于p值的理解。
为什么要用p值
从p值的英文概念——probability value——很容易理解它是某一种概率的值,这个概率的具体含义是什么?要说明这个概率的含义,我们先说明假设检验的流程,首先提出原假设和备择假设;其次,确定适当的检验统计量(如z统计量、t统计量或F统计量),并计算器数值,这一步会选定一个置信水平即α(如α=0.05或α=0.01);最后进行统计决策,决策的依据是根据样本计算出的统计量与选定置信水平下的值进行比较,然后决定是接受原假设还是拒绝原假设。
从假设检验的流程可以看出,根据检验统计量落入的区域做出是否拒绝原假设。然而当置信水平α确定后,拒绝域的位置也就确定了,这样就可以方便的进行决策,然而这个决策不够精确。假设置信水平α=0.05的统计量值zα/2=1.96,根据某个样本计算的的统计量z=2.5,落入拒绝域,我们拒绝原假设,并指导犯弃真错误的概率为0.05;如果另一个样本计算的统计量z=2.0,同样落入拒绝域,我们拒绝原假设面临的风险也是0.05。而0.05是一个通用的风险概率,这是用域表示的缺陷&