Kettle安装记录(linux)

4 篇文章 0 订阅
1 篇文章 0 订阅

目录

安装

执行

问题


安装

1.将data-integration目录压缩上传至服务器

2.打开对应目录,解压文件

unzip data-integration.zip

3.由于目录中的sh没有执行权限,所以需要设置文件权限

chmod +x *.sh

4.编译kettle,打开data-integration目录,执行代码

./kitchen.sh

①. 结果如下,显示缺少libwebkitgtk支持,需要进行安装 

[root@localhost data-integration]# ./kitchen.sh
#######################################################################
WARNING:  no libwebkitgtk-1.0 detected, some features will be unavailable
    Consider installing the package with apt-get or yum.
    e.g. 'sudo apt-get install libwebkitgtk-1.0-0'
#######################################################################

②..选择要安装目录的,下载libwebkitgtk

wget ftp://ftp.pbone.net/mirror/ftp5.gwdg.de/pub/opensuse/repositories/home:/matthewdva:/build:/EPEL:/el7/RHEL_7/x86_64/webkitgtk-2.4.9-1.el7.x86_64.rpm

③.安装libwebkitgtk

yum install webkitgtk-2.4.9-1.el7.x86_64.rpm

 到对应的目录下,重新执行编译

./kitchen.sh

执行

 

1.执行转换,如下,-param是传参,-file是执行文件位置

./pan.sh -param:name=name -param:test=test -file=/kettle/test.ktr
  • 参数说明
-version 显示版本信息
-file=filename 运行xml文件
-param:key=value 指定命名参数
-log=logging filename 设置日志文件
-level=logging level 设置日志级别
  •  日志级别
Error:只显示错误
Nothing:不显示任何输出
Minimal:只使用最少的记录
Basic:这是默认的基本日志记录级别
Detailed:详细的日志输出
Debug:以调试为目的,非常详细的输出
Rowlevel:使用行级记录,会产生大量的数据
  • 返回参数
0:转换执行成功
1:处理过程中发生错误
2:在装载或者运行时发生意外的错误
3:不能初始化转换
7:转换不能从资源库或xml中装载
8:装载步骤或插件错误(通常是装载其中一个插件错误)
9:命令行用法错误

2.执行任务,存在两种方式调用,不要混淆

文件形式-file

./kitchen.sh -param:name=name -param:test=test -file=/kettle/test.kjb

 资源形式-rep

./kitchen.sh -param:name=name -param:test=test -rep=test -user=test -pass=test -job=test
  •  参数说明
  • -rep:Repositoryname任务包所在存储名
    -user:Repositoryusername执行人
    -pass:Repositorypassword执行人密码
    -job:Thenameofthejobtolaunch任务包名称
    -dir:Thedirectory(don’tforgettheleading/or)
    -file:Thefilename(JobXML)tolaunch
    -level:Thelogginglevel(Basic,Detailed,Debug,Rowlevel,Error,Nothing)指定日志级别
    -log:Theloggingfiletowriteto指定日志文件
    -listdir:Listthedirectoriesintherepository列出指定存储中的目录结构。
    -listjobs:Listthejobsinthespecifieddirectory列出指定目录下的所有任务
    -listrep:Listthedefinedrepositories列出所有的存储
    -norep:Don’tlogintotherepository不写日志

     

问题

  • 由于从windows中直接打包迁移过来,其中data-integration/system/karaf中data开头的目录都要清空
Unexpected problem updating configuration org.apache.aries.transaction

 

 Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.

 

  •  要明确到底是rep_name方式调用还是filename方式调用,在kjb文件中的配置要和调用的代码一致,如下就是kjb文件中配置的是rep_name但是我实际调用代码用了-file方式
org.pentaho.di.core.exception.KettleXMLException: 
The transformation path /wm_get_token is invalid, and will not run successfully.
 at org.pentaho.di.trans.TransMeta.<init>(TransMeta.java:2788)
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Kettle是一款开源的ETL工具,可以用于数据抽取、转换和加载。在Linux系统上安装和配置Kettle,可以按照以下步骤进行: 1. 下载Kettle安装包,可以从官网或者其他镜像站点下载。 2. 解压安装包,可以使用命令tar -zxvf kettle-xxx.tar.gz进行解压。 3. 配置环境变量,将Kettle的bin目录添加到系统的PATH环境变量中,可以使用命令export PATH=$PATH:/path/to/kettle/bin进行配置。 4. 启动Kettle,可以使用命令./spoon.sh或者./kitchen.sh启动Kettle的图形界面或者命令行界面。 5. 配置Kettle的连接和转换,可以在Kettle的界面中进行配置,包括数据库连接、文件输入输出等。 6. 运行Kettle的转换,可以在Kettle的界面中选择需要运行的转换,然后点击运行按钮进行执行。 以上是KettleLinux系统上的安装和配置步骤,需要注意的是,Kettle的配置和使用需要一定的技术水平和经验,建议在使用前先进行学习和实践。 ### 回答2: Kettle是一个强大的开源ETL工具,可以实现数据抽取、转换和加载功能。在Linux系统上安装和配置Kettle非常简单,具体步骤如下: 一、安装Java环境 在Linux系统上运行Kettle需要Java环境支持,因此第一步需要安装Java。如果已经有了Java环境,则可以跳过此步骤。 1.使用yum安装Java 在命令行中输入以下命令: sudo yum install java-1.8.0-openjdk 2.检查Java版本号 输入以下命令,检查Java版本号: java -version 如果显示Java版本号,则表示Java环境已经安装成功。 二、下载Kettle 1.前往Kettle官网下载Kettle安装包,下载地址为:https://sourceforge.net/projects/pentaho/files/Data%20Integration/ 选择最新版本的Community Edition下载。 2.将下载的Kettle压缩包解压到指定目录下: tar -zxvf pentaho-di-8.3.0.0-371.zip -C /usr/local/ 三、配置Kettle 1.修改Kettle配置文件 进入Kettle目录下的data-integration目录,找到kettle.properties文件,修改以下配置项: a.设置Kettle使用的Java版本: PDI_JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk b.设置Kettle使用的内存大小: JAVAMAXMEM=512 c.设置Kettle的日志级别: LOGGER_MINIMUM_LEVEL=Basic 2.输入命令启动Kettle: cd /usr/local/data-integration/ ./kitchen.sh -file=/usr/local/data-integration/samples/transformations/01_Hello_World.ktr 输入以上命令后,如果没有错误提示,则表示Kettle启动成功了,可以开始使用了。 四、总结 以上就是在Linux系统上安装和配置Kettle的步骤,通过简单的几步即可完成整个过程。在使用Kettle的时候,需要了解Kettle的基本操作和功能,才能更好地使用该工具。 ### 回答3: Kettle是一款基于Java的ETL工具,可以进行数据抽取、转换和加载。Kettle可以在包括Linux在内的各种操作系统上安装和配置。下面将介绍KettleLinux系统上的安装和配置。 1. 下载Kettle安装包 可以从Kettle官网(https://sourceforge.net/projects/pentaho/files/Data%20Integration/)上下载Kettle的最新版本。选择与Linux系统对应的版本,下载后解压缩到指定的目录。 2. 安装Java运行环境 Kettle需要Java运行环境的支持,可以通过以下命令安装Java 8: ``` sudo apt-get install openjdk-8-jdk ``` 3. 配置环境变量 在终端中输入以下命令打开环境变量配置文件: ``` sudo nano /etc/environment ``` 在文件末尾添加以下两行: ``` JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 PATH=$PATH:$JAVA_HOME/bin ``` 保存并退出后,执行以下命令使配置立即生效: ``` source /etc/environment ``` 4. 运行Kettle 进入Kettle安装目录,执行以下命令启动Kettle: ``` sh spoon.sh ``` Kettle界面将出现,即表示安装配置成功。 注意:如果在执行启动命令时出现权限不够的提示,可以执行以下命令: ``` chmod +x *.sh ``` 以上就是使用Linux系统安装Kettle的详细步骤。在Kettle的使用中,可以通过配置数据源,创建转换和作业等操作,对数据进行ETL处理和管理。Kettle还提供了强大的图形化界面和功能丰富的插件,帮助用户更轻松地进行数据清洗、转换和加载等操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值