ETL是EXTRACT(抽取)、TRANSFORM(转换)、LOAD(加载)的简称,实现数据从多个异构数据源加载到数据库或其他目标地址,是数据仓库建设和维护中的重要一环也是工作量较大的一块。当前知道的ETL工具有informatica, datastage,kettle,ETL Automation,sqoop,SSIS等等。这里我们聊聊kettle的学习
一、下载
找到官网下载Kettle的安装包
二、安装
因kettle为绿色软件,解压缩到任意本地路径即可,因为kettle需要jdk环境 所以请先安装jdk环境并测试是否安装成功
三、运行
进入到Kettle目录,如果Kettle部署在windows环境下,双击运行spoon.bat或Kettle.exe文件,即可开始使用Kettle:
运行spoon
在不同的平台上运行spoon所支持的脚本:
Spoon.bat:在Windows平台上运行spoon;
Spoon.sh:在Linux、AppleOSX、Solaris平台上运行Spoon。
四、初始使用
左上角点击”文件-新建-转换“保存为demo.ktr 文件保存在你想保存的目录即可