http://blog.csdn.net/pipisorry/article/details/51182843
假设检验
假设检验问题分为两类,一类是参数的假设检验,一类是分布的假设检验! 设总体X的分布未知,或 X的某个分布参数 theta未知,对总体分布或分布参数 theta 提出一个假设 "H0" ,然后根据样本所提供的信息,运用统计分析的方法进行判断,从而作出是接受还是拒绝 "H0" 的决定,这就是假设检验问题。
假设检验的基本步骤
1 建立假设
Note: 通常将不应轻易加以否定的假设作为原假设H0。
2 选择检验统计量:给出拒绝域的形式(主要是统计量及其对应的参数c)
Note: 这里的统计量只是初始的检验统计量,一般工具里使用的检验统计量都是转换过的。如此例中x高斯正则化后的(见下面拒绝域的第二种形式)。
Note: 如果样本在拒绝域中,说明原假设错误;但是如果不在拒绝域中,并不能说明原假设是正确的,只是说不拒绝,可以接受。注意,拒绝域< >符号不同,会影响后面的判断。
3 选择显著性水平(用于确定拒绝域参数c)
Note: 显著性水平α就是拒真概率:拒绝真的H0的概率,即犯第一类错误的概率p{x ∈ W | H0}。α越大,越容易拒绝H0。
4 给出拒绝域(根据α确定拒绝域参数c)
Note: 根据拒绝域的第二种表示方法可知,当检验统计量test statistic u<=critical values u0.05时就拒绝H0假设。{使用这种判断时,拒绝和接受H0还要看拒绝域,如果拒绝域是{u<u0},则u<critical values才拒绝H0;如果拒绝域是{u>u0,则u>critical values才拒绝H0},简单来说就是如果H0:{检验统计量 >= 多少},那么检验统计量越小<= critical values(拒绝H0的值)就越拒绝H0}
检验P值
Note: P值其实就是Φ(转换后的检验统计量)。p-value是拒绝H0的最小显著性水平(最小犯第一类错误/拒绝H0至少需要的概率,即要拒绝H0,α至少要p这么大)!
通过p-value判断拒绝H0与否,只要当α<p ,则在显著性水平α下接受H0,无论拒绝域为{u>u0}还是{u<u0}};当α>p时,则在显著性水平α下拒绝H0。
换句话说,p-value为5%时,我们有95%的confidence拒绝H0假设。
[概率论与数理统计教程 2ed. - 茆诗松]
数据解释
P值
|
碰巧的概率
|
对无效假设
|
统计意义
|
P>0.05
|
碰巧出现的可能性大于5%
|
不能否定无效假设
|
两组差别无显著意义
|
P<0.05
|
碰巧出现的可能性小于5%
|
可以否定无效假设
|
两组差别有显著意义
|
P <0.01
|
碰巧出现的可能性小于1%
|
可以否定无效假设
|
两者差别有非常显著意义
|
[Data Science Dictionary: P-Values]
假设检验的基本思想和推理方法:双向检验
总体参数的假设检验
Note: 式8.1.4(这里的alpha左侧)等于号左侧计算结果即为p值。
Note: 计算出的统计量Test Statistic > Critical Value k在拒绝域中,就要拒绝H0。比如检验是否平稳,则测试结果是不平稳。
一般情况下,对于参数的假设检验,首先找出参数的一个良好估计,并以这个估计为基础构造检验统计量,要求是当原假设 H0( 成立时能完全确定其概率分布.其次确定检验统计量取值于什么区域对H0成立有利,取值于什么区域又对H1成立有利,从而确定检验的拒绝域或接受域。
[概率论与数理统计.徐全智]
from: http://blog.csdn.net/pipisorry/article/details/51182843