概率统计
liuxincumt
这个作者很懒,什么都没留下…
展开
-
数据挖掘中的抽样算法
在数据挖掘中,经常会用到抽样,比如欠(过)采样等,总的说来有两种,一种是已知样本总量n,从中随机抽m个样本;另一种是未知样本总量,从中抽取m个样本,这种情况一般是流数据,或者是很大量的数据。 问题描述就是从n个数中随机选出m个有序数字,不允许重复选择。这里n>m。下面的算法来自《编程珠玑》,或者《计算机程序设计艺术》1.当n已知依次考虑整数0,1,2。。。n-1,通过适当的随机测试原创 2012-09-19 16:25:11 · 4021 阅读 · 0 评论 -
Kolmogorov-Smirnov检验
Kolmogorov-Smirnov检验它是检验单一样本是否来自某一特定分布的方法。比如检验一组数据是否为正态分布。它的检验方法是以样本数据的累计频数分布与特定理论分布比较,若两者间的差距很小,则推论该样本取自某特定分布族。即对于假设检验问题:H0:样本所来自的总体分布服从某特定分布H1:样本所来自的总体分布不服从某特定分布这里我们仅以Kolmogorov-Smirnov正转载 2012-09-25 11:05:01 · 12884 阅读 · 3 评论