linux下的kettle

一、下载kettle

官网7.1版本:Pentaho from Hitachi Vantara - Browse /Data Integration/7.1 at SourceForge.net

安装unzip

yum install -y unzip zip

安装jdk

保证linux上面已经安装jdk,因为kettle是用Java开发,依赖于jdk

解压kettle

unzip pdi-ce-7.1.0.0-12.zip

添加权限

进入data-integration文件夹,如果里面.sh文件没有权限,可以使用命令增加

chmod +x ./data-integration/*.sh

测试是否部署成功

cd /www/download/kettle/data-integration

进入data-integration文件夹

输入:./kitchen.sh

出现帮助信息,则证明可以运行。如下图:

运行

./pan.sh -file=/www/download/kettledata/linux测试.ktr

成功

过程中出现的问题

com.mysql.cj.jdbc.Driver 驱动缺失

将 mysql-connector-java-8.0.16.jar驱动包放入/www/download/kettle/data-integration/lib 

 可以参考文章:kettle案例九-----linux使用kettle_张小凡vip的博客-CSDN博客_kettle linux使用

二、kettle配置定时任务

创建脚本文件

创建脚本文件目录 kettleShell 和日志文件 kettleLogs

cd /www/download/kettle
mkdir  kettleShell  kettleLogs

在到目录kettleShell文件下创建test.sh脚本 

vim test.sh
export JAVA_HOME=/www/download/jdk8/jdk1.8.0_281
export JRE_HOME=/www/download/jdk8/jdk1.8.0_281/jre
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH
TIME=$(date "+%Y%m%d")
/www/download/kettle/data-integration/pan.sh -file=/www/download/kettle/kettledata/linux测试.ktr  >> /www/download/kettle/kettleLogs/log$TIME.log

 前面三行配置java路径,最后一行配置kettle的工具路径、运行转换文件的路径、转换过程的日志

安装crontab

yum install vixie-cron
yum install crontabs

查看crontab服务是否运行

/sbin/service crond status
或
ps -elf|grep crond|grep -v "grep"

 crontab命令

systemctl start crond   开启
systemctl stop crond    关闭
systemctl status crond  查看状态
systemctl restart crond 重启
systemctl reload crond  重新加载配置 
crontab -l //列出当前的所有调度任务
crontab -l -u jp   //列出用户jp的所有调度任务

更多crontab知识: https://www.iteye.com/blog/panyongzheng-2220839

编辑定时时间

crontab -e
*/10 * * * * /www/download/kettle/kettleShell/test.sh

此处为每隔10分钟运行一次,输出的日志为test.log

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在Linux下安装Kettle的步骤如下: 1. 下载Kettle安装包,可以从官网或者其他可靠的下载站点下载。 2. 解压安装包,可以使用命令tar -zxvf kettle-xxx.tar.gz进行解压。 3. 进入解压后的目录,执行./spoon.sh命令启动Kettle。 4. 如果出现错误提示,可以根据提示安装相应的依赖库。 5. 如果需要在Linux系统中使用Kettle的定时任务功能,可以使用crontab命令设置定时任务。 6. 安装完成后,可以根据需要进行配置和使用Kettle。 注意事项: 1. 在安装Kettle之前,需要确保系统已经安装了Java环境。 2. 在使用Kettle时,需要根据实际情况进行配置,包括数据库连接、文件路径等。 3. 在使用Kettle的定时任务功能时,需要确保系统时间准确无误。 ### 回答2: Kettle 是一款非常流行的 ETL 工具, 它可以用来在数据库之间移动和转换数据。而 Linux 也是非常流行的开源操作系统,与 Kettle 的开源理念不谋而合。下面是在 Linux 上安装 Kettle 的步骤: 1. 首先,打开终端并输入以下命令以更新系统,以获得最新的软件包列表。 sudo apt-get update 2. 安装 Java 运行时环境。Kettle 需要 Java 来运行。 通过以下命令安装 Java sudo apt-get install openjdk-8-jre 3. 下载 Kettle。 在 Kettle 的官方网站中可以找到最新版本的软件包。建议将软件包下载到 Home 目录,可以使用 wget 命令来下载文件。下载完成后使用 tar 命令,解压文件 $ wget https://sourceforge.net/projects/pentaho/files/Data%20Integration/6.1/pdi-ce-6.1.0.1-196.zip/download 4. 验证 Kettle 是否安装完成。 在终端中转到 shell 目录 ,然后执行该目录下的 spoon cd data-integration ./spoon.sh 如果 Kettle 成功启动,则 Kettle 的界面将被显示在终端中,您现在可以使用该工具来进行 ETL 操作了。 现在,您已经成功在 Linux 上安装 Kettle。 祝您在 ETL 工作中取得成功。 ### 回答3: KettleKettle又名Pentaho Data Integration)是一种开源的ETL工具,它可以帮助用户快速地将不同数据源中的数据整合在一起,并将它们导入到目标位置中。以下是在Linux系统上安装Kettle的方法: 步骤1: 下载Kettle软件包 首先需要下载适用于Linux系统的Kettle的二进制软件包。用户可以通过以下网址下载Kettle:https://sourceforge.net/projects/pentaho/?source=typ_redirect。 步骤2: 安装Java Virtual Machine(JVM) Kettle需要依赖Java运行时环境(Java Virtual Machine)来运行。在安装Kettle之前,请确保在Linux系统中已经安装了JVM。该过程可以使用以下命令来完成: sudo apt-get update sudo apt-get install default-jre 步骤3: 解压Kettle软件包 下载二进制软件包后,解压该文件,可以使用以下命令完成: sudo tar -xzvf kettle-xxx.tar.gz -C /opt 在解压过程中,需要将您的Kettle版本替换成“xxx”。 步骤4: 设置Kettle环境变量 为了能够有效地使用Kettle,需要设置一些环境变量。使用文本编辑器,打开.bashrc文件: nano ~/.bashrc 在文件末尾添加以下内容: export KETTLE_HOME=/opt/kettle export PATH=$KETTLE_HOME:$PATH 保存文件并执行以下命令: source ~./bashrc 步骤5: 运行Kettle 安装完成后,即可通过以下命令启动Kettle: ./opt/kettle/kitchen.sh 此外,还可以使用spoon.sh命令,它可用于启动基于图形界面的Kettle接口。 总的来说,通过上述步骤,用户可以在Linux系统上安装Kettle,并开始使用该ETL工具来处理数据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值