简介
拟合优度检验是一类对于数据是否为正态分布没有要求的检验方法,通过这种方法可以对非正态分布的数据进行检验,同样也能对正态分布的数据进行检验。检验原理如下:
1)将得到的数据进行按区间划分。
2)得到数据按区间划分的频数分布表,并将区间标准化。
3)计算各区间按标准正态分布对于的期望频率,通过这一期望频率得到期望频数fe。
4)计算chi-square。
5)对比显著度的临界值,如果大于则确定数据不符合正态分布,如果小于则确定数据在该显著度符合正态分布。
具体步骤可按下表进行:
区间 | 频数 | z-values | 期望频率 | 期望 | 频数 | chi-square |
---|
通过python编写,代码如下:
#利用频率检验数据分布是否为正态分布
def test_for_normility(data, c, sig):
mean = data.mean()
n = len(data)
std = data.var()*(n/(n-1))
data_g = data.groupby(pd.cut(data.iloc[:,0], c)).count()
data_g.rename(columns = {
0:'count'},inplace = True)
data_g['left'