1.定义一个新的变量ts3,将年龄<35赋值为1,【35,55)赋值为2,【55,)赋值为3
提示:转换–重新编码为不同变量
2.将年龄做条形图。
提示:转换–可视离散化。 注:用三倍标准差的拆分方法可以排除异端值
3.求把年龄做怎样的划分,他们用有汽车的百分比差别最大
提示:转换–最优离散化
4.将c0_1 c0_2 c0_3设置为复选框 名称为c0 提示:分析–多重响应–定义变量集
然后对c0进行频率分析:提示:分析–多重响应–频率,得到图:
百分之14.2 为有效值 163/1147 反应贷款家庭的百分比
百分之85.8 为缺失值 984/1147 反应没有贷款家庭的百分比
有163个有效值,说明有163个人选择了至少一项选项
下表为对有效人数163人的统计。
选择房贷的有118个人。
百分之72.4为:选择房贷人数118占总人数163的百分比
百分之53.2为:选择房贷人数118占总
百分之122.1的意思为:平均每个人选择了几个选项,即平均每个人选择了1.22个选项
个案百分比为:应答人数百分比。即选择这个选项的人数占总人数的百分比。反应了百分之多少的人会选择这个选项。
响应百分比:也就是应答次数百分比。即这个选项被选择的次数占总次数的百分比。它反映了这个选项的受欢迎程度。
5.对连续型指标完整的描述体系:
对于正太分布:集中趋势用平均数,离散趋势用标准差。分布形状描述指标:计算峰度系数和偏度系数。
非正态分布:集中趋势用中位数,离散趋势用四分位数间距。
对于离群值和极端值,要拆出来单独做描述。用离群值与计算值列表来反映。