1. K-S正态检验
1.1 概念
K-S检验不仅能够检验单个总体是否服从某一理论分布,还能够检验两总体分布是否存在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。
这里是以变量值的秩作为分析对象,而非变量值本身。
1.2 用处
K-S检验通过对两个分布之间的差异的分析,判断样本的观察结果是否来自制定分布的总体
1.3 细节
观测数组不一定符合正态分布,需要手动传入均值和方差(默认 0,1)。
1.4 F值公式
1.5 P值计算
Statistics.kolmogorovSmirnovTest
1.6 MLlib算法
org.apache.spark.mllib.stat. Statistics. kolmogorovSmirnovTest