5.1.2 不完全去重 数据清洗过程中,所有字段值都相等的重复值是一定要剔除的。根据不同的业务场景,有时还需要选取其中若干字段进行去重操作。 1.打开Kettle工具,创建转换 2.配置文本文件输入控件 3.配置唯一行(哈希值)控件