2.1 Kettle简介
2.1.1 Kettle概述
Kettle是国外免费的开源轻量级ETL工具,是基于Java语言开发的,可以在Windows.Linux,UNIX系统上运行,且绿色不需安装,可用于各种数据库之间的连接。
Kettle工具主要有四个组件组成,分别是Spoon,Pan,Kitchen以及Carte组件,具体功能如下: *Spoon为集成开发软件,用于构建作业和转换,执行或调试作业和转换,还可以用于监控ETL操作性能。
*Pan以命令行形式执行Spoon生成的转换程序。
*Kitchen以命令行的方式执行Spoon生成的作业程序
*Carte是一个重要组件,是基于Jetty的轻量级HTTP服务器,主要用于监控HTTP执行作业和转换的进度。
2.1.2Kettle设计原则:易于开发,避免自定义开发,所有用户都可以通过用户界面完成,无命名限制,透明,灵活的数据通道,只映射需要映射的字段。
2.2 Kettle的下载安装
1、Kettle官网的下载地址为:http://sourceforge.net/projects/pentaho/files/Data%20Integration/,在官网下载安装包。
2、解压文件,执行spoon.bat。
3、配置Kettle(在网上搜索即有详细的引导步骤)。
4、启动Kettle。
2.3 Kettle的基本概念
Kettle工具的执行分为两个层次,即转换和作业,这两个层次的主要区别在于数据传递和执行方式。具体如下图: