转换组件主要是在转换中起到加工处理的作用。
介绍:排序记录,去除重复记录,拆分字段,字段选择。
注意:在使用【去除重复记录】组件之前一定要对去重的字段进行排序
使用一个小示例来介绍这几个组件的使用,数据准备如下:
要求目标表数据如下,即需要把原数据中name列不规范的数据处理掉并进行去重:
Kettle是个专业的数据处理工具,在复杂处理逻辑下,最好是将这些处理步骤交给Kettle来做,而不是全部扔给数据库去做;
a. 拖出如下组件构成一个完整的转换流程:
转换组件主要是在转换中起到加工处理的作用。
介绍:排序记录,去除重复记录,拆分字段,字段选择。
注意:在使用【去除重复记录】组件之前一定要对去重的字段进行排序
使用一个小示例来介绍这几个组件的使用,数据准备如下:
要求目标表数据如下,即需要把原数据中name列不规范的数据处理掉并进行去重:
Kettle是个专业的数据处理工具,在复杂处理逻辑下,最好是将这些处理步骤交给Kettle来做,而不是全部扔给数据库去做;
a. 拖出如下组件构成一个完整的转换流程: