(八)分类数据分析
首先思考问题:
1. 为什么要对数据进行分类?如何对数据分类?
2. 数据分类后,如何对分类数据进行分析?
数据分类
分类变量的结果表现为类别,例如:性别 (男, 女)
各类别用符号或数字代码来测度
使用分类或顺序尺度
- 你吸烟吗? 1.是;2.否
- 你赞成还是反对这一改革方案? 1.赞成;2.反对
对分类数据的描述和分析通常使用列联表
可使用检验
统计量
可以用于测定两个分类变量之间的相关程度。若用表示观察值频数(observed frequency),用表示期望值频数(expected frequency),则统计量可以写为:
统计量有如下特征:首先 ,因为它是对平方结果的汇总;其次,统计量的分布与自由度有关;最后, 统计量描述了观察值与期望值的接近程度。两者越接近,即 越小,计算出的 值就越小;反之, 越大,计算出的值也越大。检验正是通过对的计算结果与分布中的临界值进行比较,作出是否拒绝原假设的统计决策。
分布与自由度的关系如上图所示。上图中显示了自由度分别为 1,5 和 10 时相应的 分布。
自由度越小,分布就越像左边倾斜,随着自由度的增加,