目录
去重
先将重复记录找出并标记,然后根据是否重复标记顺序,将宠物标记记录排在一起,再将其删除
将所有变量都放入【定义匹配个案的依据】无特殊要求,其他默认
会出现一个【最后一个基本案例】的变量,0代表重复,1代表唯一
【最后一个基本个案】右键【升序排序】,选中0的个案,右键【清除】
字段抽取拆分
Substr(字符串,提取的起始位置,提取的字符个数)
随机抽样
抽取20%的样本量
出现一个【filter_$】变量,0表示记录未被选中的抽取,1表示记录被选中抽取,对没有选中的进行【/】标记,在不关闭 spss 情况下,后续都是对选中数据进行分析
字段合并
Concat()
【转换】【计算变量】
记录合并
【数据】【合并文件】【添加个案】
检查合并字段是否一样,类型是否一样,否则可能失败
数据分组-可视分箱子-等距分组
【转换】【可视分箱子】
选择分组变量
根据分布图,来确定步骤3
点击【生成标签】
数据分组-重新编码-不等距分组
【转换】【重新编码为不同变量】
【继续】【变量化】【确定】即完成
0-1标准化
数据按比例缩放,使之落到一个特定区间目的是为了消除单位的影响
0-1标准化,也称为离差标准化,它是对原始数据进行线性变换,使结果落到【0,1】区间,方便十分制,百分制的换算
x* = (x - min) / (max - min)
【转换】【计算变量】,在【数值表达式】中输入公式即可
z 标转化
也称标准差标转化,它是将变量中的观察值(原数据)减去该变量的平均值,除以该变量的标注差经过处理的数据符合正态分布,即均值为0,,标准差为1,
x* = (x - u) / o
【分析】【描述统计】【描述】