一、概述
1.kettle是什么
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。提供图形化的操作界面,可以通过拖拽控件的方式,方便地定义数据传输的拓扑。Kettle支持丰富的数据输入输出源,数据库支持Oracle,MySql,DB2等,也支持业界各种开源的大数据系统,例如HDFS, HBase, Cassandra, MongoDB等。中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
更多介绍,参考kettle中文网:http://www.kettle.net.cn/
2.kettle四大家族
Chef(中文:厨师)、Kitchen(中文:厨房)、Spoon(中文:勺子)、Pan(中文:平底锅)---注意英文发
Chef—工作(job)设计工具 (GUI方式)
Kitchen—工作(job)执行器 (命令行方式)
Spoon—转换(transform)设计工具 (GUI方式)
Span—转换(transform)执行器 (命令行方式)
二、安装与配置
1.前置条件
JDK1.8
2.下载
Data Integration (or Kettle) 7.1版本下载:https://sourceforge.net/projects/pentaho/files/Data%20Integration/7.1/pdi-ce-7.1.0.0-12.zip/download
3.安装
因Kettle是开源工具,下载的压缩包直接解压到本地路径即可。
4.启动
由于是WIN平台,双击 Spoon.bat:
启动画面:
启动完成:
三、常见问题
说明JDK版本与kettle版本不匹配(这里kettle7.0匹配jdk1.8的版本)