安装环境说明
jdk 采用 jdk-8u102-windows-x64
kettle采用kettle 8.2
文末,博主会将kettle下载地址附上,还包含其他版本(作为本专栏开博小福利)。kettle9.0版本以下,本教程都适用,kettle9.0及更新的其他版本,博主暂未测试。若有小伙伴测试过,可以留言告知博主。
一、Kettle介绍
1、kettle是什么
Kettle是一款国外开源的ETL工具,纯java编写,由于java具有跨平台的特性,故Kettle可以在Windows、Linux、Unix上运行,数据抽取高效稳定。
Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
2、kettle产品
Kettle目前包括4个产品:Spoon、Pan、CHEF、Kitchen。
SPOON: 允许你通过图形界面来设计ETL转换过程(Transformation)。
PAN: 允许你批量运行由Spoon设计的ETL转换 (例如使用一个时间调度器)。Pan是一个后台执行的程序,没有图形界面。
CHEF: 允许你创建任务(Job)。 任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了。
KITCHEN: 允许你批量使用由Chef设计的任务 (例如使用一个时间调度器)。KITCHEN也是一个后台运行的程序。
注:本专栏主要介绍Spoon。
二、安装步骤
1.安装jdk及配置环境变量
安装jdk
jdk的安装比较简单,直接下一步就可以了。但是如果需要修改存储路径,则在如下图中所示的步骤中选择安装路径,然后再点击下一步即可。
配置环境变量
右击“此电脑”–属性–高级系统设置-环境变量,在弹出的环境变量页面选择新建系统变量,在新增页面输入变量名和变量值,变量名可根据自己的习惯填写,变量值即为上一步存储的jdk的位置。
在系统变量中找到Path,选中Path,点击“编辑”,在弹出的编辑环境变量页面点击“新建”,输入:%JDK_HOME%\bin;。这里的“JDK_HOME"即为上一步输入的变量名。
在dos窗口输入java -version,出现如下信息,即为安装成功。
目前暂未遇到安装失败的情况。
2.安装kettle
Kettle的安装比较简单,下载Kettle安装,直接解压即可。然后启动Spoon.bat。如下图。
踩过的坑
1、运行Spoon.bat,出现闪退,先检查自己的jdk版本问题,若jdk版本无问题,则通过文本打开Spoon.bat修改内存。2、运行Spoon.bat,提示A Java Exception has occurred,也是jdk版本问题。
3、启动页右上角无“Connect”按钮,jdk版本过高,降低jdk至1.8即可。
4、连接MySQL数据库,提示 Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) ,下载mysql ,放到kettle安装目录的lib文件下(即data-integration/lib)。mysql包在下面链接中。
kettle版本下载地址:(本链接会持续更新)
链接:链接:https://pan.baidu.com/s/1GMDguJI7enZTI69nYa3Hyg
提取码:v0jc