一、kettle简介
kettle是一款国外的一款开源ETL工具,纯Java编写。可以运行在Windows、Linux、Unix等操作系统上,数据抽取稳定,高效。
kettle中有两种脚本文件:transformation和 job;
(1) transformation :转换,主要用于对基础数据的抽取和转换,如表输入、文本输入等;
(2) job:作业,主要用于完成整个作业流程的控制。如:start、success;
kettle家族包括四个产品:spoon、pan、chef、kitchen
(1) spoon : 通过图形界面建立转换和作业,完成ETL转换过程;
(2) pan : 通过命令行运行转换文件,没有图形界面;
(3) kitchen :通过命令行运行作业文件,无图形界面;
(4) chef : 允许你创建Job。 job通过允许每个转换,作业,脚本等,更有利于自动化更新数据仓库的复杂工作。
(这个产品我今天才听说,也不晓得该怎么用,回头研究一下。)
二、kettle 的安装部署
由于kettle是纯Java编写,因此安装kettle之前需要先安装jdk环境。具体的安装部署工程,很多大神已经写的很详细具体了。这里贴出一个示例。
kettle下载链接:https://pan.baidu.com/s/17uttX6izjQNlSgg1MHUfbg 密码:bjak
(内含jdk安装文件、kettle安装包、所需jar包)
安装部署过程:https://jingyan.baidu.com/article/49ad8bce4ab6495834d8fa83.html
说明:本机安装的kettle是8.1版本,jdk版本是1.8 。
此外还需注意,kettle安装好以后,在访问相关的关系型数据库,则需要下载对应的链接驱动,放到kettle的安装目录下的lib 文件夹中,否则在连接数据库的时候会报错。
本文引用了百度百科中的《如何安装kettle》一文,具体链接为:https://jingyan.baidu.com/article/49ad8bce4ab6495834d8fa83.html
本文引用了 kettle官网的下载链接。http://community.pentaho.com/projects/data-integration/