Kettle安装部署

       目前,ETL工具的典型代表有:

        商业软件:Informatica PowerCenter,IBM InfoSphere DataStage,Oracle Data Integrator,Microsoft SQL Server Integration Services等

        开源软件:Kettle,Talend,Apatar,Scriptella等

        Kettle是一款国外开源的ETL工具,它采用Java编写,可以跨平台运行,绿色无需安装,数据抽取高效稳定,主作者是Matt Casters,2003年就开始了这个项目,目前最新稳定版为8.2。
        2005年12月,Kettle从2.1版本开始进入了开源领域,一直到4.1版本遵守LGPL协议,从4.2版本开始遵守Apache Licence 2.0协议。
        Kettle在2006年初加入了开源的BI公司Pentaho, 正式命名为:Pentaho Data Integeration,简称“PDI”。
        自2017年9月20日起,Pentaho被合并于日立集团下的新公司: Hitachi Vantara
        Kettle可以简化数据仓库的创建,更新和维护,使用Kettle可以构建一套开源的ETL解决方案。

        中文社区:Kettle 中文社区

        源码:GitHub/pentaho-kettle

        安装包(已编译好,免安装):PDI下载

        1.下载这个压缩包:

        2.直接解压,运行Spoon即可启动

假如启动不成功,需要配置一下环境变量:

变量名:PENTAHO_JAVA_HOME
变量值:H:\Java\jre1.8.0_161

可以按照本机的配置(主要是内存大小),配置一下spoon.bat



if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m" "-XX:MaxPermSize=256m"

--按需调整以上的几个数字

VM的几个参数:
-Xms2058mJVM初始分配的堆内存
-Xmx1024mJVM最大允许分配的堆内存,按需分配
-XX:PermSize=128MJVM初始分配的非堆内存
-XX:MaxPermSize=256MJVM最大允许分配的非堆内存,按需分配

        Kettle是一个组件化的集成系统,包括如下几个主要部分:
        1.Spoon:图形化界面工具(GUI方式),Spoon允许你通过图形界面来设计Job和Transformation,可以保存为文件或者保存在数据库中。也可以直接在Spoon图形化界面中运行Job和Transformation,
        2.Pan:Transformation执行器(命令行方式),Pan用于在终端执行Transformation,没有图形界面。
        3.Kitchen:Job执行器(命令行方式),Kitchen用于在终端执行Job,没有图形界面。
        4.Carte:嵌入式Web服务,用于远程执行Job或Transformation,Kettle通过Carte建立集群。
        5.Encr:Kettle用于字符串加密的命令行工具,如:对在Job或Transformation中定义的数据库连接参数进行加密。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值