一、数据清洗的总体步骤
image.png
打开telco.sav文件
image.png
看下数据清洗的步骤,要拷贝(因为这里是样本,所以不用做这一步),所以直接做第二步创建唯一ID
image.png
这一步创建了唯一ID,点击转换按钮---计算变量-目标变量填写ID--选择函数$casenum点击确定就可以了
image.png
接下来我们要生成数据质量报告,可以用分析按钮-描述统计-频率来做,选取除了ID外的所有字段(因为ID不需要检查),点击确定,生成结果。
image.png
可以看到,有四个字段有缺失值,接下来每个变量都要仔细的看
image.png
zone这里每个zone都是有效的
image.png
age这个字段变量都在合理范围,年龄分布从18到77岁,但是如果这里突然出现
一个100岁的,或者11岁的,我们就要看看,回顾下数据采集过程,这个数据是否错误&#x