列联表是观测数据按两个或更多属性(定性变量)进行交叉分类时所列出的频数表。列联表分析常用来判断同一个调查对象的两个特性之间是否存在明显相关性。
一个实际频数fij的期望频数eij,是总频数的个数n乘以该实际频数fij落入第i行和第j列的概率,即
![d1e5a5db6d4113cb4b902cefa719e930.png](https://img-blog.csdnimg.cn/img_convert/d1e5a5db6d4113cb4b902cefa719e930.png)
χ2统计量的计算公式为
![91f1dcdda7e0c08497a822fc2ec3d72c.png](https://img-blog.csdnimg.cn/img_convert/91f1dcdda7e0c08497a822fc2ec3d72c.png)
其自由度为(r-1)(c-1)。χ2独立性检验可以检验列联表中行变量与列变量之间的相关性。根据显著性水平α和自由度(r-1)(c-1)查出临界值χa2,若χ2>=χa2则行变量与列变量之间是相关的;若χ2<=χa2,则行变量与列变量之间独立。
Excel提供函数CHITEST计算χ2统计量的概率,提供函数CHIINV计算临界值χα2。
函数语法:CHITEST(actual_range, expected_range)
CHITEST函数语法具有以下参数。
● actual_range为包含观察值的数据区域,将对期望值作检验。