秉承借助分析Kettle的机会,巩固JavaSE基础,学习优秀源代码程序。
1. Kettle工具 简介
(1)Kettle 是一款国外开源ETL工具,有两种脚本文件: transformation 和 job。
(2)transformation 完成针对数据的基础转换。
(3)job 完成对整个工作流的控制。
注释:ETL 是 数据抽取(Extract),转换(Transform),装载(Load) 的过程。
2. Kettle工具里的相关概念
(1) Job : 一个作业,由不同逻辑功能的 entry 组件 构成。
注释: 数据从一个 entry组件 传递到另一个 entry组件, 并在 entry组件 中进行相应的处理。
(2)Transformation : 完成针对数据的基础转换,即一个数据转换过程。
(3)Entry : 实体,即 job型组件。用来完成特定功能应用,是job的组成单元,执行单元。
(4)Step : 步骤,是Transformation的功能单元,用来完成整个转换过程的一个特定步骤。
(5)Hop : 工作流或转换过程的流向只是,从一个组件指向另一个组件,
在kettle 源工程中有三种hop: 无条件流向,判断为真时流向,判断为假时流向。
</