Kettle组件
Kettle安装成功后,在data-integration目录下可以看到如下四个特殊的.bat或者.sh文件,它们分别对应于Kettle的四个组件:
-
Spoon.bat/spoon.sh:用于启动Kettle的集成开发环境Spoon。它提供一个基于SWT的图形用户界面,主要用于构建ETL Jobs(作业)和Transformation(转换),也可以用于执行或调试作业和转换,还可以用于监控ETL操作的性能。
-
Pan.bat/pan.sh:Pan以命令行的方式执行转换,运行在后台,没有图形化用户界面。
-
Kitchen.bat/kitchen.sh:Kitchen以命令行的方式执行作业,运行在后台,没有图形化用户界面。
-
Carte.bat/carte.sh:Carte是基于Jetty的轻量级HTTP服务器,运行在后台,用于远程执行并监控作业和转换或在集群中并行执行作业和转换。
Kettle的概念模型
通常一个数据抽取过程主要包括创建一个Job(