缺失值是指数据集中某个或某些属性的值是不完整的,产生的原因主要有人为原因和机械原因两种,其中机械原因是由于机器故障造成数据未能收集或存储失败,人为原因是由主观失误或有意隐瞒造成的数据缺失。
1.打开Kettle工具,创建转换
2.配置文本文件输入控件
3.配置字段选择控件
4.配置过滤记录控件
5.配置Excel输出控件
6.运行转换并查看文件file.xls
缺失值是指数据集中某个或某些属性的值是不完整的,产生的原因主要有人为原因和机械原因两种,其中机械原因是由于机器故障造成数据未能收集或存储失败,人为原因是由主观失误或有意隐瞒造成的数据缺失。
1.打开Kettle工具,创建转换
2.配置文本文件输入控件
3.配置字段选择控件
4.配置过滤记录控件
5.配置Excel输出控件
6.运行转换并查看文件file.xls