问题描述
最近在项目遇到一个问题,想定时检查logstash进程是否挂掉,若挂掉自动启动。于是利用linux的crontab功能,添加一个计划任务,每分钟执行一个脚本查看logstash的进程是否还在,如果不在则启动之,否则不做任何事情。
结果发现这个脚本在shell终端手工运行能够正常执行,但是加到crontab中定时执行时却没有生效。
脚本如下:log_up.sh
#!/bin/bash
time=$(date "+%Y-%m-%d %H:%M:%S")
echo $time >> /data/1.log
echo "start" >> /data/1.log
ps -fe|grep /data/logstash|grep -v grep
if [ $? -ne 0 ]
then
echo "logstash 未启动" >> /data/1.log
nohup /data/logstash/bin/logstash -f /data/logstash/logstash.conf &
echo "logstash 完成启动" >> /data/1.log
else
echo "logstash 正在运行" >> /data/1.log
fi
echo "end" >> /data/1.log
echo " " >> /data/1.log
问题重现过程
- 停掉logstash
- 将上述脚本log_up.sh添加到crontab中,每一分钟执行一次,并将结果输出在/data/1.log文件中
执行结果如下:
从执行的log日志中看,脚本确实判断除了当前logstash没运行,然后执行了logstash启动脚本,但结果没有启动成功。
在shell终端中,手动执行log_up.sh脚本,结果如下:
可以看到,启动成功了。从执行日志中看,手动执行后,后续crontab自动执行脚本,监测到logstash已启动
因此,crontab中自动执行log_up.sh没有启动成功,问题可能就出在logstash启动的命令。
nohup /data/logstash/bin/logstash -f /data/logstash/logstash.conf &
问题解决
经过一番百度,发现问题可能出在环境变量上,于是在脚本中加入一条语句,执行时将环境变量输出到日志中,
echo $PATH >> /data/1.log
手动执行脚本时,输出的环境变量为:/usr/java/jdk1.8.0_211/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin
而crontab自动执行后,输出的环境变量为:/usr/bin:/bin
在log_up.sh加入一行代码:
export PATH="/usr/java/jdk1.8.0_211/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin"
保证脚本在crontab中运行时和在shell中手动执行时相同的环境变量,结果发现脚本在crontab中可以执行成功。