分析数据正态分布检验方法

在对特定分析对象进行建模分析时,一般假设该模型变量服从正态分布,然后采用符合该变量的分析方法建立相关的分析模型。此外,根据熵定理,自然参数一般服从正态分布(高斯分布),因此,在进行建模之前,需要对所分析的数据进行正态分布检验分析,根据数据正态分布特性判断数据采集策略及模型性能优化方法。

目前数据正态分布检验方法主要分为3类:

1. 图形分析方法(graphical methods)

该类方法主要通过对分析数据建立直观图形判断是否服从正态分布,常用的图形分析方法主要有:直方图、Q-Q图及箱形图;

2. 数值方法(numerical methods)

该类方法通过检测分析数据的偏度(skewness)和峰度(kurtosis)实现正态测试;

3. formal normality test(应该翻译为正式正态检测)

主要包含经典正态分布检测方法:Shapiro(SW),Kolmogorov-Smirnov(KS),Lillefors(LF) test 和Aderson-Darling (AD),这4种方法是目前较广的分析方法,此外,在MATLAB中还有Jarque-Bera (JB)测试也用于数据正态分布测定。上述方法的数据公式表达依次为:

W=\frac{\sum_{i=1}^n (a_iy_i )^2)}{\sum_{i=1}^n(y_i-\bar{y_i})^2}

T=sup_x\left | F^*(X)-F_n(x) \right |

D=max_x\left | F^*(X)-S_n(x) \right |

W_n^2=n\int \left [ F_n(x)-F^*(x) \right ]^2\psi (F^*(x))dF^*(x)

公式中各个变量含义及泛函表示请参考文献《Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov,Lilliefors and Anderson-Darling tests》。

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值