对于一组需要建模分析的数据,在将数据导入spssmoderler后,首先要做的工作应该是对数据进行处理,分类,筛选的工作,可以说这是整个数学建模中最基础的部分,也是必不可少的部分。
1、对数据进行审核并替换或删除空值。
导入数据后,应先对数据进行审核,观察字段是否有缺失值,异常值等,具体操作为“输出——数据审核——运行”,得到以下界面
从图中可以看出,id和age字段有效值数量不同,说明字段age存在空值,根据字段重要性可以选择删除或者替换数据,我们这种情况选择替换空值。选择“字段选项——填充”,先选择要填充字段及替换条件,此处替换为零
预览一下,发现空值被替换为0(替换用@MEAN函数)
也可用平均值替换空值
如果样本量足够大,可以考虑删除字段中的空值,集体操作为“记录选项——选择—