Spss
的数据预处理
数据预处理的目的:
在数据文件建立好后,通常还要对待分析的数据进行必要的预加工处
理,这是数据分析过程中不可缺少的一个关键环节。数据的预加工处理是服
务与数据分析和建模的,需要解决的问题如下:
1
、
缺失值和异常数据的处理。
2
、
数据的转换处理。数据的转换处理是在原有数据的基础上,
计算产生
一
些含有更丰富信息的新数据或对数据原有分布进行转换等。
3
、
数据抽样。从实际问题、算法或效率等方面考虑,并非收集到的所有
数据
(个案)在某项分析中都有用途,有必要按照一定的规则从大量
数据中选取部
分样本参与分析。
4
、
选取变量。并非所有数据项(变量)在某项分析中均有意以,选取部
分变量
参与分析是必要的。
Spss
提供了一些专门的功能辅助用户实现数据的预加工处理工
作,通过预处理还可以使用户对数据的总体分布有所了解。
、数据预处理步骤:
1
、数据的排序:
(
1
)
数据排序的目的:
a
通常数据编辑窗口中个案的前后次序是由数据数录入的先后顺序决
定的,数据
排序便于数据的浏览,有助于了解数据取值状况、缺失
值数量的多少。
、通过数据排序能够快速找到最大值和最小值,进而可以计算出数据
的全距,
快速把握和比较数据的离散程度。
c
、通过数据排序能够快速发现数据的异常值。
(
2
)
、数据排序的步骤:
a
选择菜单:【
Date
】
f
【
Sort Cased
b
、指定主排序量到【
Sort by
】框中,并选择【
Sort Order
]框中
的选项指出
该变量按升序还是降序排序排序。【
Asce nding
】表示升序,