数学之路(3)-数据分析(11)

5、正太检验与分布拟合 

R中使用函数shapiro.test()进行正态W检验

> shapiro.test(cp$产量..)

        Shapiro-Wilk normality test

data:  cp$产量..

W = 0.9671, p-value = 0.7903

p值小于某个显著水平a(0.05)时,认为样本不是来自于正态分布的总体。

0.7903>0.05,可认为产量是正态分布的。

 

Kolmogorov-Smirnov检验

它是检验单一样本是否来自某一特定分布的方法。比如检验一组数据是否为正态分布。它的检验方法是以样本数据的累计频数分布与特定理论分布比较,若两者间的差距很小,则论该样本取自某特定分布族。

Kolmogorov-Smirnov正态性检验

Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。其原假设H0:两个数据分布一致或者数据符合理论分布。

D=max| f(x)- g(x)|,当实际观测值D>D(n,α)则拒绝H0,否则则接受H0假设。

R语言中ks.test完成正态性检验。

ks.test(x, y, ...,

        alternative = c("two.sided", "less", "greater"),

            exact = NULL)

有四个参数,第一个参数x为观测值向量,第二个参数y为第二观测值向量或者累计分布函数或者一个真正的累积分布函数如pnorm,只对连续CDF有效。第三个参数为指明是单侧检验还是双侧检验,exact参数为NULL或者一个逻辑值,表明是否需要计算精确的P值。

比如我们生成2个随机的正态分布,然后检验这2个分布是否是同一类型的分类

> ks.test(rnorm(80),rnorm(40))

        Two-sample Kolmogorov-Smirnov test

data:  rnorm(80) and rnorm(40)

D = 0.125, p-value = 0.7874

alternative hypothesis: two-sided

>

如果我们把作为原假设,即被检验的假设,称作零假设,此外同时存在备择假设或对立假设。p值大于0.05,不拒绝原假设,认为这2个分布是同一类型。

但要注意:Kolmogorov-Smirnov检验要求待验分布是连续的,而连续分布出现相同值的概率为0。也就是说数据中倘出现相同值,则连续分布的假设不成立


本博客所有内容是原创,未经书面许可,严禁任何形式的转载。

http://blog.csdn.net/u010255642


  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值