统计学习:夏皮罗-威尔克检验(Shapiro–Wilk test)

前言

最近在处理信号的过程中,感觉自己的知识不够用,因此开始了统计学的复习之路。
目录:

1介绍

夏皮罗-威尔克检验是一种在频率上统计检验中检验正态性的方法。它在1965年由夏皮罗和威尔克发表

2理论

该检验的零检验是样本 x1,,xn x 1 , ⋯ , x n 来自于一个正态分布的母体。

这个检验的统计量是:

W=(ni=1aix(i))2ni=1(xix¯¯¯)2, W = ( ∑ i = 1 n a i x ( i ) ) 2 ∑ i = 1 n ( x i − x ¯ ) 2 ,

其中

  • x(i) x ( i ) 用括号包含下标索引i的;不与 x x 混淆,它是第i阶统计量,即样本中的第i个最小数

  • x¯¯¯=(x1++xn)/n x ¯ = ( x 1 + ⋯ + x n ) / n 是样本的平均值。

  • 常量 aiai a i a i 通过公式[1]

    (a1,,an)=mTV1(mTV1V1m)1/2,(1) (1) ( a 1 , … , a n ) = m T V − 1 ( m T V − 1 V − 1 m ) 1 / 2 ,

m=(m1,,mn)T m = ( m 1 , … , m n ) T

其中 m1,,mn m 1 , … , m n
是从一个标准的正态分布随机变量上采样的有序独立同分布的统计量的期望值。
V V 是这些有序统计量的协方差。

3解释

这个统计检验的假设是样本来自于一个正态母体,
因此,一方面,如果p值小于选择的显著度水平( α α 值 通常0.05),那么在更大概率下我们应该拒绝零假设,数据的证据显示我们的样本不是来自一个正态分布母体。另一方面,如果p值比选择的显著度水平大,那么我们没有证据拒绝零假设,数据来自于一个正态分布。(举个栗子,如果p值是0.05,同时选择的显著度水平是0.05,那么应该拒绝零假设,数据来自与一个正态分布母体。)
和大多数统计学显著性测试一样,如果样本空间足够大,那么该检验可以发现零假设的每一个细节。(即虽然这里可能有统计显著性效用,但它实在太小而不可能是任何一个实际的统计显著性。)因此,通常建议做额外的效果因子调查,例如,这种情况下的一个Q-Q图。

4功效分析

蒙特卡罗仿真发现该检验在给定显著性的情况下,有最好的功效,接下来是Anderson-Darling,kolmogorov-smimov和lilliefors检验。

5近似计算

Royston 提出了一个备用的可以将样本扩展到2000维时计算协同向量的方法,该方法被用在了很多软件中。


wiki文档

  • 21
    点赞
  • 71
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值