Kolmogorov-Smirnov test 详细介绍

Kolmogorov-Smirnov test

本文主要从以下几个角度来方面来介绍Kolmogorov-Smirnov test

  • Kolmogorov-Smirnov test 的用途
  • Kolmogorov-Smirnov test 的过程
  • Kolmogorov-Smirnov test 各数值代表的数学意义
  • Kolmogorov-Smirnov test 计算工具

用途

  • 无论是人文科学,还是社会科学,都会面临处理数据的问题,人文科学领域常见的是统计调查得到的数据,而自然科学,多则为实验数据(包括物理实验和计算机模拟实验)。那么,当我们面对这些统计数据的时候,我们的第一个问题就是去推测它们到底符合怎样一种分布的问题(当然也可能是一种无规律的分布)。这实际上就涉及到一个假设检验的问题:假设某统计数据X(一个1×n的向量,n为lengthX),服从某种分布(可能是泊松分布,正态分布,对数正态分布…),那么怎么去衡量假设H成立或者拒绝的可能性呢?那么Kolmogorov-Smirnov test就是去判断假设成立与否的一种常用方法(当然还有其他一些方法,不同的方法之间衡量方式不同,苛刻程度也不尽相同,可能某数据用方法A test是正态分布,而用B test就不满足正态分布,所以选取方法一定要谨慎,这里单独只讲kstest,是因为它应用的普遍性)

过程

  • 下面这个图片很好的说明了kstest的原理

来自维基百科
蓝线表示数据,红线表示假设假定符合的分布。
而X轴表示数据值的大小,Y轴表示的数据累计所占百分比。如果简单理解实际上就是概率密度函数的积分。这这个图里面红线实际上就是正态分布的情况,而蓝线因为是离散化的数据,所以呈现的是阶梯状。两条线之间的最大距离也就是黑色箭头表现的位置就表示了二者之间的最大区别程度,称为D,D值的大小则决定了两组数据间的差异。用这种百分数的差别来表现差异,有一个最明显的好处,那就是不会因为某一个点的异常而否定所以的点。此外,KEST还可以检验多种分布,只需要把红线换成其他的线即可。
到这里我们仅仅得到了D值,还不能完全判定两者的符合程度,这时候还需要引入显著度α(alpha默认为0.05),学习过了概率论的假设检验这章的各位应该知道显著度的意义:
未完,待续

  • 4
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值