起因:
因项目需要增加定时检测,如果检测不到则执行启动命令功能 , 脑中第一方案就是脚本中telnet服务端口,端口若检测不到则执行 java -jar 命令 , 后考虑一阵后决定使用 ps -ef | grep service.jar 命令检测
脚本如下:
checkservice.sh
#!/bin/bash
##检测后端服务是否正常, 检测不到则执行启动脚本
DATE=`date "+%Y-%m-%d %H:%M:%S"`
java_id=`ps -ef | grep service.jar | grep -v "grep" | awk '{print $2}'`
echo $DATE'------当前pid为:'$java_id >> /home/user/service/checkservice.log
if [ "$java_id" = "" ]
then
echo $DATE"------service not exists . start service ..." >> /home/user/service/checkservice.log
/bin/sh /home/user/service/startservice.sh
echo $? >> /home/user/service/checkservice.log
java_id1=`ps -ef | grep service.jar | grep -v "grep" | awk '{print $2}'`
echo $DATE"------new pid is : "$java_id1 >> /home/user/service/checkservice.log
else
echo $DATE"------service exists!" >> /home/user/service/checkservice.log
fi
echo "===================================================================================================================================================" >> /home/user/service/checkservice.log
手动执行上述sh脚本时能够正常检测, 并在我kill掉服务时成功启动服务 , 但是将改脚本挂到 crontab上时, 该脚本虽被调用 , 但是在服务kill掉时没能重新启动 .
此时 crontab 配置如下:
* * * * * /home/user/service/checkservice.sh
排查经过:
1.查看 /var/spool/mail/user 日志文件,未发现异常日志
2.且我自己打印的checkservice.log ,日志每隔一分钟正常打印
3.checkservice.sh脚本中调用的启动脚本内只有java -jar命令 , 在启动脚本java -jar 前后增加日志输出 , 结果日志正常打印到日志文件内, 证明启动脚本也执行了 , 关键在于java -jar命令没有生效
4.网上查了一下说是需要脚本内增加 source /etc/profile , 尝试了一下 依旧如旧 , 没能生效.
最终方案:
最终用了个取巧的办法 , crontab 定时任务模拟手动执行脚本
* * * * * cd /home/user/service/ && /bin/sh /home/user/service/checkservice.sh
生产急需改脚本 时间不是很充裕, 没能测试引包方式解决.