填充缺失值
数据挖掘中,面对的通常都是大型的数据库,它的属性有几十个甚至几百个,因为其中某个属性值的缺失而放弃大量其他的属性值,这种删除是对信息的极大浪费,所以产生了插补缺失值的思想与方法。常用的填充缺失值方法如下。
1.打开Kettle工具,创建转换
2.配置文本文件输入控件
3.配置过滤记录控件
4.配置替换NULL值控件
5.配置合并记录控件
6.配置替换NULL值2控件
7.配置字段选择控件 8.运行并查看文件
数据挖掘中,面对的通常都是大型的数据库,它的属性有几十个甚至几百个,因为其中某个属性值的缺失而放弃大量其他的属性值,这种删除是对信息的极大浪费,所以产生了插补缺失值的思想与方法。常用的填充缺失值方法如下。
1.打开Kettle工具,创建转换
2.配置文本文件输入控件
3.配置过滤记录控件
4.配置替换NULL值控件
5.配置合并记录控件
6.配置替换NULL值2控件
7.配置字段选择控件 8.运行并查看文件