今天的文章主要介绍两个内容:卡方检验的适用条件以及R*C交叉表检验。首先,卡方检验的适用条件主要是针对表格的理论频数(还不太懂什么叫理论频数,点击此文)
以上n代表总的样本量,如果是四格表卡方检验,就是两组人群之和,如下图,常用的符号可以了解一下:
明白了卡方检验的适用条件,我们看看什么是RC交叉表检验,以前的教程也叫R*C列联表。
这里R表示行(英文Row),C表示列(英文Colomun),所以两者合起来就表示为,超过两行或两列的表格比较。
大家熟悉的四格表是比较两组率的差异,而R*C交叉表就是用来比较多组率(或多个构成比)的差异。
案例: 比较某地区区男、女性的饮食口味是否存在差异,研究人员对该地区555名男性,819名女性居民的膳食结构进行调查。数据整理如下。
本例用相比四格表增加了一列,属于2*3交叉表的情形。本质上看,卡方检验实际上是在看男性与女性人群在饮食口味上的分布是否一致,即男女喜欢清淡、一般和重口味的人数比例是否一致。
本例用SPSS操作的数据结构表如下:
"xingbie"、”kouwei"、"F"分别为变量名,代表:“性别”、“口味”和“人数或频数”
检验结果为:
由上表可知 P=0.283 > 0.05,在α=0.05水平上不拒绝零假设,即不能认为该地区男女的饮食口味不同。
其中”卡方检验“表的注脚显示”0个单元格的期望计数小于5“,意味着本例的卡方检验条件满足,不需要校正。