背景:
学习,学习,还是TM的学习(微笑脸)!
1.kettle简介
官网:http://infocenter.pentaho.com
1.1 ETL是什么?
ETL分别是“Extract”、“ Transform” 、“Load”三个单词的首字母缩写也即数据抽取、转换、装载的过程,但我们日常往往简称其为数据抽取。
ETL的工具功能:必须对抽取到的数据能进行灵活计算、合并、拆分等转换操作。
kettle就是一款开源的ETL工具。
1.2.Kettle
Kettle 是 PDI 以前的名称,PDI 的全称是Pentaho Data Integeration,Kettle 本意是水壶的意思,表达了数据流的含义。Kettle是一款国外开源的ETL工具,纯java编写。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
源码:https://github.com/pentaho/pentaho-kettle
2.kettle安装
官网:https://sourceforge.net/projects/pentaho/files/
不区分linux和windows,选择一个顺眼的版本,下载即可。
这里博主下载的是9.1版本,下载后如下所示,压缩包快2G了:
windows下直接解压,在解压出来的data-integration文件夹下,有一个Spoon.bat的windows脚本,双击,即可启动kettle。