Kettle工具的基本使用
- kettle概述:
- Kettle工具主要是由4个组件组成,分别是Spoon、Pan、Kitchen、Carte组件。
- Spoon是Kettle的集成开发环境,会提供基于SWT的图形用户界面,主要用于构建ETL Jobs(作业)和Transformations(转换),也可用于执行和调试作业、转换,还可以用于监控ETL操作的性能。
- Pan是以命令行的方式(即编写Shell脚本)执行Spoon生成的Transformations程序,运行在后台,并且该组件没有图形用户界面。
- Kitchen是以命令行的方式(即编写Shell脚本)执行Spoon生成的Jobs程序,运行在后台,并且该组件没有图形化用户界面。
- Carte是Kettle中的一个重要组件,它是基于Jetty的轻量级HTTP服务器,运行在后台,主要用于远程监控HTTP执行Jobs和Transformations的进度。
- Kettle的设计原则:
- 1、易于开发
- 2、避免自定义开发
- 3、所有功能都能通过用户界面完成
- 4、没有命名限制
- 5、透明
- 6、灵活的数据通道
- 7、只映射需要映射字段
- Kettle的基本概念
-
一个数据的抽取过程主要包括创建一个作业,并且每个作业可以包括多个转换操作。
-
Kettle工具的