0 数据集
以人员收入和消费数据为例进行实践
1 类别变量频数分析
1.1 类别变量频数表
比如统计数据中人员的来源情况,对“来源”变量进行频数表绘制。
操作步骤:【分析】→【描述统计】→【频率】
然后将要处理的变量拖入到“变量”窗口,核实无误后点击【确定】按钮(窗口中是默认勾选显示频率表,如果没有勾选可以手动勾选后点击【确定】按钮)
生成结果如下。其中第一个表格就是对数据缺失值信息的统计,第二个变就是类别变量频率表,第一列显示为频数,第二列为各类别的占比,第三列是有效占比(由于没有缺失值,所以第二列和第三列一致),最后一列为累计百分比。
1.2 帕累托图
数据中最高学历变量中的类别数量较多,适合采用帕累托图进行分析展示。
操作步骤:【分析】→【质量控