背景:
1、本人liunx环境下用root用户启动java应用程序
2、手动执行shell脚本可以正常检测如果应用程序停止则启动成功
3、通过crontab 定时执行shell脚本启动失败
4、crontab -l
*/1 * * * * /opt/linkcm/wcse/wcse-runtime-0.0.1/wcse-restart.sh
解决过程
1、通过打日志,发现不是在/root目录下面的shell脚本检测统计应用程序的进程数量 都没有启动,统计进程数量就是1
eg:解决过程:把shell脚本放到/root目录
2、启动java
#!/usr/bin/env bash
log_file=/home/wcse_monitor.log
num=ps -ef | grep wcse-runtime-0.0.1 | grep -v grep | wc -l
echo “查询到的进程数量为$num”>>
l
o
g
f
i
l
e
i
f
[
"
log_file if [ "
logfileif["num" == “0” ]; # 判断进程是否存在
then
echo “进程挂掉了,开始进行重启,重启开始时间为date
” >> $log_file
cd /opt/linkcm/wcse/wcse-runtime-0.0.1 && pwd
./startup.sh
process_id=ps -ef | grep wcse-runtime-0.0.1 | grep -v grep | awk '{print $2}'
# 获取新进程号
echo “进程已重新启动,重启完成时间为date
,新的进程号为$process_id” >> $log_file # 将新进程号和重启时间记录
else
process_id=ps -ef | grep wcse-runtime-0.0.1 | grep -v grep | awk '{print $2}'
# 获取当前进程号
echo “进程正在运行中,当前时间为date
,当前进程号为$process_id” >> $log_file
fi
发现问题
应用程序启动失败,单独执行shell脚本是执行成功的
1、解决问题
在启动脚本中增加
#!/usr/bin/env bash
source /etc/profile #刷新环境变量
2、可以定期监测启动应用了
[root@wcse02 ~]# crontab -l
*/1 * * * * /root/wcse-restart.sh