1、Kettle介绍
Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle家族目前包括4个产品:Spoon、Pan、CHEF、Kitchen。
SPOON 允许你通过图形界面来设计ETL转换过程(Transformation)。
PAN 允许你批量运行由Spoon设计的ETL转换 (例如使用一个时间调度器)。Pan是一个后台执行的程序,没有图形界面。
CHEF 允许你创建任务(Job)。 任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了。
KITCHEN 允许你批量使用由Chef设计的任务 (例如使用一个时间调度器)。KITCHEN也是一个后台运行的程序。
2、JDK安装
Kettle比较简单,仅需要依赖JDK,第一次我装的是JDK14,出现数据库连接的错误,赶紧重装JDK1.8。
https://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html#license-lightbo
安装之后添加环境变量或用户变量:
增加JAVA_HOME条目:
D:\Program Files\Java\jdk1.8.0_261
增加CLASSPASS条目:
%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar
path 条目,添加以下内容:
%JAVA_HOME%\bin
%JAVA_HOME%\jre\bin
在cmd能查看到版本即可:
λ Java -version
java version "1.8.0_261"
Java(TM) SE Runtime Environment (build 1.8.0_261-b12)
Java HotSpot(TM) 64-Bit Server VM (build 25.261-b12, mixed mode)
3、Kettel安装
Kettel解压即用,无需安装。
因为最近外网访问下载速度慢,而且容易断,我都是在集群下载转本地
wget https://udomain.dl.sourceforge.net/project/pentaho/Data%20Integration/7.1/pdi-ce-7.1.0.0-12.zip
解压后,进入data-integration文件夹,双击Spoon.bat。