kettle基础介绍
kettle,ETL工具的一种,现在kettle改名了,叫Pentaho Data Integration(PDI),但更多时候大家还是习惯用之前的名字kettle。
Kettle是一款国外开源的ETL工具,纯java编写(依赖jdk),可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
Kettle中有两种脚本文件,transformation(.ktr)和job(.kjb)
- transformation:完成针对数据的基础转换
- job:则完成整个工作流的控制。
kettle的四个核心组件
- SPOON(勺子): 允许你通过图形界面来设计ETL转换过程(Transformation)。 (GUI方式)
- PAN(平底锅):允许你批量运行由Spoon设计的ETL转换 (transform执行器)。(命令行方式)
- CHE