SPSS数据处理有六个步骤,分别是:
- 数据导入
- 数据清洗
- 数据抽取
- 数据合并
- 数据分组
- 数据标准化
数据处理是根据数据分析的目的,将收集到的数据,用适当的处理方法进行加工、整理,形成适合数据分析的要求样式,它是数据分析前必不可少的工作,并且在整个数据分析工作量中占据了大部分比例。
我们先来学习前三个步骤:数据导入、数据清洗、数据抽取
先来了解下数据变量是什么?
在数据库中,我们将数据变量称为字段,而在统计学中我们称之为变量。
常用的数据类型:
字符型数据、数值型数据、日期型数据
字符型数据
文本数据,有字符串组成,不能进行算数运算的文本数据类型,包括中文字符、英文字符、数字字符(非数值型)等字符。
字符型数据是一种分类数据。
数值型数据
自然数或度量单位进行计量的数值数据。
特殊的分类数据。
日期型数据
表示日期或时间数据,它可以进行算数运算,所以它是一种特殊的数值型数据。
日期型数据主要应用在时间序列分析中。
变量尺度:
在统计学中,按照对事物描述的精确程度,将采用的测量尺度从低到高分为4个层次:定类尺度、定序尺度、定距尺度和定比尺度。
定类尺度:对事物类别或属性的一种测度。
- 特点:值只能代表事物的类别和属性,不能比较各类别之间的大小。
- 例如:性别、职业…
- SPPS中,使用" 名义(N)"来表示定类尺度。
- 注意:使用定类尺度对事物进行分类时,一定要符合相互独立,完全穷尽原则,也就是麦肯锡的经典原则——MECE原则。相互独立意味着对事物的分类在同一纬度上并且有明确区分、不可重叠的;完全穷尽则意味着全面、周密,对事物的分类没有遗漏。
定序尺度:对事物之间等级或者顺序的一种测度。
- 计算结果