卡方检验是一种拟合优度检验,用于检验样本内每一类别的实际观察数目与某条件下的理论期望数目是否显著差异。
常用于定类尺度数据,当期望值小于5时,需要合并。
卡方检验,它的原假设Ho:行分类向量与列分类向量无关
H1:行分类向量与列分类向量有关
设以下统计量:
fi为样本资料的计数,ei为Ho为真时的理论数值(期望值)。
检验统计量服从自由度为k-1的卡方分布。
最常用的是检验某种已知比例,或是否为统一分布等问题。
若n个相互独立的随机变量ξ₁,ξ₂,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
#探究自由度K大小对结果的影响:
plt.figure(dpi=100)
#PDF K=1
plt.plot(np.linspace(0,15,100),stats.chi2.pdf(np.linspace(0,15,100),df=1))
plt.fill_between(np.linspace(0,