在进行统计分析时,经常需要对某些数据进行重新处理,如年龄、身高、收入等,了解他们的分布或进行分析。
1、SPSS的数据变换,主要命令有四种:
2、Recode 命令:重新编码数据,重新安排数据
3、Compute命令:对原始数据进行四则运算或指数运算等,派生出新的变量
4、Count命令:创建一个新变量来计算某些变量值所出现的次数
5、If命令:如果表达式成立,则创建一个新变量
一.Recode 命令对数据重新编码
1.基本格式
Recode V1, V2…(原值1=新值1)…(原值m=新值n)
/X1,X2…(原值1=新值1)…(原值m=新值n).
几个变量重新编码,如果变量值不一样,可以用反斜杠 / 隔开
Recode命令与变量、括号之间要有空格
在原值中使用的关键词有:
lo(Lowest)
HI(highest)
Thru
Missing
Else
Sysmis
2.举例
recode age (0 thru 20=1)(21 thru 40=2)(41 thru 60=3)(61 thru
100=4).
recode age (lo thru 20=1)( 21 thru 40=2)(41 thru 60=3)(61 thru
hi=4).
recode V1 to V3(0=1)(1=0)(3=2).
recode v1,v2,v3(0=1)(1=0)(3=2).
用missing再编码缺省值(如把原定为99岁的缺省值改为00岁,则:
recode age (missing=00).
Missing关键词不能出现在右边
Recode age (00=missing). 是错误的。
Recode value age (00). 是正确的
对系统缺省值sysmis进行重新编码。系统缺省值是SPSS内部把无效的值自动打上“·”而剔除掉。
recode age (missing=sysmis).
没有关键词时的重新编码
recode age (0,20=1)(21,40=2)(41,60=3)(61,100=4).
对字符串重新编码有一些特别的要求
recode sex (’M’=’A’)( ’F’=’B’).
recode
name(’wangsan’=’wan ’).
注意:新旧字符串的长度必须相等,不足的