前言
最近在处理信号的过程中,感觉自己的知识不够用,因此开始了统计学的复习之路。
目录:
1介绍
夏皮罗-威尔克检验是一种在频率上统计检验中检验正态性的方法。它在1965年由夏皮罗和威尔克发表
2理论
该检验的零检验是样本 x1,⋯,xn x 1 , ⋯ , x n 来自于一个正态分布的母体。
这个检验的统计量是:
W=(∑ni=1aix(i))2∑ni=1(xi−x¯¯¯)2, W = ( ∑ i = 1 n a i x ( i ) ) 2 ∑ i = 1 n ( x i − x ¯ ) 2 ,
其中
x(i) x ( i ) 用括号包含下标索引i的;不与 x x 混淆,它是第i阶统计量,即样本中的第i个最小数
x¯¯¯=(x1+⋯+xn)/n x ¯ = ( x 1 + ⋯ + x n ) / n 是样本的平均值。
常量 aiai a i a i 通过公式[1]
(a1,…,an)=mTV−1(mTV−1V−1m)1/2,(1) (1) ( a 1 , … , a n ) = m T V − 1 ( m T V − 1 V − 1 m ) 1 / 2 ,
m=(m1,…,mn)T m = ( m 1 , … , m n ) T
其中
m1,…,mn
m
1
,
…
,
m
n
是从一个标准的正态分布随机变量上采样的有序独立同分布的统计量的期望值。
V
V
是这些有序统计量的协方差。
3解释
这个统计检验的假设是样本来自于一个正态母体,
因此,一方面,如果p值小于选择的显著度水平(
α
α
值 通常0.05),那么在更大概率下我们应该拒绝零假设,数据的证据显示我们的样本不是来自一个正态分布母体。另一方面,如果p值比选择的显著度水平大,那么我们没有证据拒绝零假设,数据来自于一个正态分布。(举个栗子,如果p值是0.05,同时选择的显著度水平是0.05,那么应该拒绝零假设,数据来自与一个正态分布母体。)
和大多数统计学显著性测试一样,如果样本空间足够大,那么该检验可以发现零假设的每一个细节。(即虽然这里可能有统计显著性效用,但它实在太小而不可能是任何一个实际的统计显著性。)因此,通常建议做额外的效果因子调查,例如,这种情况下的一个Q-Q图。
4功效分析
蒙特卡罗仿真发现该检验在给定显著性的情况下,有最好的功效,接下来是Anderson-Darling,kolmogorov-smimov和lilliefors检验。
5近似计算
Royston 提出了一个备用的可以将样本扩展到2000维时计算协同向量的方法,该方法被用在了很多软件中。