spss 数据处理

目录

去重

字段抽取拆分

随机抽样

字段合并

记录合并

数据分组-可视分箱子-等距分组

数据分组-重新编码-不等距分组

0-1标准化

z 标转化


去重

先将重复记录找出并标记,然后根据是否重复标记顺序,将宠物标记记录排在一起,再将其删除

将所有变量都放入【定义匹配个案的依据】无特殊要求,其他默认

会出现一个【最后一个基本案例】的变量,0代表重复,1代表唯一 

【最后一个基本个案】右键【升序排序】,选中0的个案,右键【清除】

 

 

字段抽取拆分

Substr(字符串,提取的起始位置,提取的字符个数)

 

 

随机抽样

抽取20%的样本量

出现一个【filter_$】变量,0表示记录未被选中的抽取,1表示记录被选中抽取,对没有选中的进行【/】标记,在不关闭 spss 情况下,后续都是对选中数据进行分析

 

 

字段合并

Concat()

【转换】【计算变量】

 

 

记录合并

【数据】【合并文件】【添加个案】

检查合并字段是否一样,类型是否一样,否则可能失败

 

 

数据分组-可视分箱子-等距分组

【转换】【可视分箱子】

选择分组变量

 根据分布图,来确定步骤3

点击【生成标签】

 

 

数据分组-重新编码-不等距分组

【转换】【重新编码为不同变量】

【继续】【变量化】【确定】即完成

 

 

0-1标准化

数据按比例缩放,使之落到一个特定区间目的是为了消除单位的影响

0-1标准化,也称为离差标准化,它是对原始数据进行线性变换,使结果落到【0,1】区间,方便十分制,百分制的换算

x* = (x - min) / (max - min)

【转换】【计算变量】,在【数值表达式】中输入公式即可

 

 

z 标转化

也称标准差标转化,它是将变量中的观察值(原数据)减去该变量的平均值,除以该变量的标注差经过处理的数据符合正态分布,即均值为0,,标准差为1,

x* = (x - u) / o

【分析】【描述统计】【描述】

 

 

 

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值