1.卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。
2.这一类检验称为拟合性检验。 其自由度通常为分类数减去1,理论次数通常根据某种经验或理论。
3.总而言之,卡方拟合度检验用于判断不同类型结果的比例分布相对于一个期望分布的拟合程度。卡方拟合性检验适用于变量为类别型变量的情况。
4.python定义拟合优度检验
'''
(1)假设检验重要知识
H0:类别A与B的比例没有差异 H1:类别A与B的比例有差异
若卡方值大于临界值,拒绝原假设,表示A与B不相互独立,A与B相关
函数中re返回为1表示拒绝原假设,0表示接受原假设
(2)参数说明
输入:
alpha --- 置信度,用来确定临界值
data --- 数据,请使用numpy.array数组
sp --- 表示输入数组的形状参数,默认为一维
输出:
chis --- 卡方值,也就是统计量
p_value --- P值(统计学名词),与置信度对比,也可进行假