1. Kolmogorov-Smirnov 检验
检验一个样本是否服从既定的分布时,或者检验两个样本是否来自同一个分布时,可以用 Kolmogorov-Smirnov 检验,简称 KS 检验。
该检验被归为非参数检验(非参数检验是在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法),而 参数检验是在总体分布已知的情况下,对总体分布的均值或方差等进行检验。
KS 检验的基本思想是:根据经验分布函数与期望分布函数的累计分布的差值,可以构造一个服从 Kolmogorov 分布的统计量,进而进行检验。
类似的检验还有 Shapiro–Wilk 检验。
2. χ 2 \chi^2 χ2 卡方检验
卡方检验也属于非参数检验,一般用于分类变量,检测实际频数与期望频数是否一致,广泛用于列联表(由行分类变量,列分类变量组成)的检验(检验两个变量是否相互独立)。
一个类别变量的卡方检验一般叫做拟合优度检验,统计量的计算公式为:
χ 2 = ∑ ( f 0 − f e ) 2 f e \chi^2=\sum\frac{(f_0-f_e)^2}{f_e} χ2=∑fe(f0−fe)2
其中, f 0 f_0 f0 为观察频数, f e f_e fe 为期望频数。
两个类别变量时,又称作列联表的独立性检验,统计量的计算公式为:
χ 2 = ∑ ∑ ( f 0 − f e ) 2 f e \chi^2=\sum\sum\frac{(f_0-f_e)^2}{f_e} χ2=∑∑fe(f0−fe)2
其中,期望频数
f
e
f_e
fe 的计算公式为:
f
e
=
R
T
n
×
C
T
n
×
n
f_e=\frac{RT}{n}\times\frac{CT}{n}\times n
fe=nRT×nCT×n
n n n 为样本量, R T RT RT 为行的合计频数, C T CT CT 为列的合计频数。