数据准备
现有一份社会人员调查信息的数据文件people_survey,由于某种原因,数据采集的过程中产生了大量的缺失值。
下面将通过Kettle工具,使用平均填充法对缺失值进行填充。
步骤:
1.打开kettle工具,创建转换fill_missing_value,添加如下控件及Hop跳连接线
2.配置“文本文件输入”控件
添加相关字段
预览数据
3.配置“过滤记录”控件
4.配置“替换NULL值”控件
5.配置“合并记录” 控件
6.配置“替换NULL值2”控件
7.配置“字段选择”控件
移除flagfield字段
8.运行转换fill_missing_value
完成了缺失值的填充!