kettle使用linux crontab的定时任务启动

文章目录

背景

  1. 使用kettle开发数据同步, 由于资源有限,将kettle同步及mysql服务安装在了一台机器。
  2. 某一天,mysql服务器突然挂了, 整个服务器都因内存溢出挂掉了,磁盘空间也快撑爆了。于是排查, 发现在将所有的kettle进程kill掉之后, 内存占用大幅下降, 初步判定应该是kettle定时任务的跑完之后内存没有释放导致的。
  3. kettle定时任务是个常驻进程的任务, 有点占着那啥不那啥. 感觉解决问题的方向应该是使用linux的crontab
  4. kettle为什么没有释放内存?这里涉及到java的内存管理了, 有点力不从心

解决方案

在shell脚本中配置好一系列的参数,使用shell脚本启动kettle,脚本大致内容如下:
filename: <kettle_data_syn_start.sh>

#! /bin/sh
base_dir="/home/projects/kettle"
config_file="${base_dir}/db_config.ini"
log_level="Basic"
log_file="${base_dir}/logs/kettle_log_`date +%Y%m%d-%H%M%S`.log"
kettle="${base_dir}/data-intergration/kitchen.sh"
kjb_file="${base_dir}/syn/data_syn_start.kjb"

${kettle} -file="f{kjb_file}" -param:config_file="${config_file}" -level=${log_level} -log=${log_file}

问题在背景里交代过了,也比较明显, 下面解决是解决流程
困惑:

  1. 使用 sh kettle_data_syn_start.sh, 命令可以将任务跑起来, 整个流程都是OK的, 但将此命令放到crontab里, 查看日志发现报java命令未找到的异常, 这什么鬼?
  2. 各种查资料, 发现有个方法,就是在这个shell脚本前面加上一些声明的环境变量,结果可以跑起来
  3. 修改完之后的脚本如下:
#! /bin/sh
export JAVA_HOME="/usr/local/jdk1.8.0_181"
export JRE_HOME="${JAVA_HOME}/jre"
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${PATH}/bin:$PATH

base_dir="/home/projects/kettle"
config_file="${base_dir}/db_config.ini"
log_level="Basic"
log_file="${base_dir}/logs/kettle_log_`date +%Y%m%d-%H%M%S`.log"
kettle="${base_dir}/data-intergration/kitchen.sh"
kjb_file="${base_dir}/syn/data_syn_start.kjb"

${kettle} -file="f{kjb_file}" -param:config_file="${config_file}" -level=${log_level} -log=${log_file}

结果可以正常运行

另一个问题: kettle自身的定时任务结束后没有释放内存, 问题到底出现在哪儿

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值