Spss 数据属性及其定义方法
写在前面:接下来的几篇都是与spss操作相关的内容,将自己曾经有困惑或者使用频率较高的内容介绍出来,最后一篇将会是Airbnb相关实战分析 我也不知道能不能坚持到最后一篇
只是个小白,所以欢迎大家纠错
字数:1410 ,基础级别,难度一个星,建议阅读时长60秒:
- 变量名的命名
1)首字符必须是字母或汉字
2)结尾不能是圆点、句号或者下划线
3)长度不能超过64个字符-32个汉字
4)变量名必须唯一,且不区分大小写
5)保留字不能做变量名(i.e. ALL,BY)
6)默认变量为“VAR”,后接5个数字(就是没有名称会自动补充)
- 变量类型
1)定制货币(Custom currency)是自定义的,未事先定制的CCA,CCB,系统默认为逗号数值型。
2)系统默认数值型的宽度(Width)默认值为8,小数位(Decimal)默认值为2。下面介绍修改方法:
编辑–选项–数据(Edit–Options–Data)
- 缺失值的处理
这里的缺失值不仅仅指NULL值,也包括特殊数值(有些系统用-1表示数值不存在)
补救方法:
1)人工填写(结果好但时间久;数据规模大,方法不可行)
2)离散值自动填充(类型是字符串,第三个选项不可选)
- 测量
三种标度(Scale)-有序(Ordinal)-名义(Nominal)
可以理解成三个尺度逐层递减
尺度名称 | 例子 |
---|---|
标度 | 温度、重量(连续性);年龄(离散型); 时间(日期变量);货币 |
有序 | 低年级、中年级、高年级用1、2、3表示(数值型、字符型) 【数值大小有意义】 |
名义 | 男为1,女为0【数字大小无意义】 |
- 标签
善用标签,方便自己整理
下一篇预告:数据清洗与处理