一、列联表分析(独立性检验,非参数检验)
列联表是两个和两个以上变量的交叉分类汇总表,根据变量个数分为1维,2维,3维, ... ,1维即频数分布表。下图为2x2列表。
列联表分析分为3步:
1)建表;
2)对变量之间的相关性进行检验,通常利用卡方统计量进行检验。
卡方独立性检验需要满足的条件:
- 交叉表中的值应该是频数,而不是相对频率(所占百分比)
- 每个分类变量的各个类别是互斥的
- 每一个观测值只属于交叉表中的一个单元格
- 变量中的各个类别是互相独立的
- 所有期望频数应该大于5,样本总量大于40
3)计算相关系数
Example: 检验满意度与学历的相关关系。
1) H0假设:学历与满意度无关系.
2) 计算卡方统计量