(1)Kettle简介
参考文章:https://blog.csdn.net/u013468915/article/details/82629260
Kettle是ETL中其中一个开源工具,基于纯Java开发。
kettle有两种脚本transformation(转换)和Job(作业)
Kettle有三个主要组件:Spoon、Kitchen、Pan
Spoon:是一个图形化的界面,可以让我们用图形化的方式开发转换和作业。
Kitchen:利用Kitchen可以使用命令行调用Job
Pan:利用Pan可以用命令行的形式调用Trans
Carte:Carte是一个轻量级的Web容器,用于建立专用、远程的ETL Server。
(2)Kettle下载
参考文章
https://blog.csdn.net/legend818/article/details/105946902
1-1 文章中百度网盘亲测可用
链接:https://pan.baidu.com/s/1uaZ6Wp0OYyAF91P7qa4Qzg
提取码:w8h4
我下载的是pdi-ce-8.2.0.0-342,大小约1.1G
1-2 或官网下载:百度进入kettle的官网
https://community.hitachivantara.com/docs/DOC-1009855
点击打开,往下面翻滚,点击8.2Stable 稳定版,在弹出的页面进行下载保存 ,官网需要注册,据说下载较慢,未亲自使用。
(3)Kettle配置
参考文章:https://blog.csdn.net/spurs611/article/details/80916143
配置kettle运行环境:
创建用户变量。变量名输入:PENTAHO_JAVA_HOME;
变量值输入jdk的安装路径。
(4)Kettle安装
将下载的kettle压缩包解压出来。由于kettle是绿色无安装版的,所以解压后进入解压路径,你可以看到一些子目录,以及一些bat文件。
Window系统双击Spoon.bat来启动kettle程序;
Linux系统双击Spoon.sh来启动kettle程序。
(5)Kettle简单使用教程
参考文章:https://blog.csdn.net/u013468915/article/details/82629260
摘要如下:
1.创建一个简单的转换
首先这个转换的事例是把testdb数据库中的t_user表的数据拷贝到test表数据库中的user表。
2.创建一个简单的作业
这个作业就是将之前的转换以定时执行的方式运行。
3.连接资源库
在实际的团队开发过程中,不可能将自己的转换、作业和调度等配置存放在自己的电脑中。而Kettle的资源库正可以将我们的转换、作业等存储下来,构成一种协作平台。
具体步骤见上参考文章