一、出现的问题
有一个守护脚本XXX.sh,需要使用oracle用户在linux上配置定时任务,每1分钟检查执行一次。但是发现该脚本使用oralce用户手动启动没问题,能正常把程序启动起来,而使用crontab并没有把程序启动起来。
二、排查分析问题
1.程序本身是否有问题
通过使用nohup命令,发现程序能够正常执行,说明程序本身没有问题。
2.脚本是否有问题
既然能手动执行脚本,把程序启动起来,说明脚本本身没有问题。
3.定时任务是否有问题
编辑定时任务
crontab -e
*/1 * * * * sh /home/oracle/XXX.sh > /tmp/test.log
在XXX.sh中加了一些打印,定时任务重定向输出到test.log,通过查看test.log日志,如果有输出就说明执行了XXX.sh 脚本。
4.定时任务执行脚本时启动程序是否有问题
在XXX.sh脚本中,加一下启动程序 标准错误重定向到标准输出的日志。
nohup XXXXX > test2.log 2>&1 &
通过查看 test2.log 日志发现报了没有加载到动态库的错误:
error while loading shared libraries: libocci.so.19.1:cannot open shared object file: No such file or directory
按道理讲,用oracle用户启动怎么会加载不到libocci.so动态库呢?很是郁闷。。。后来排查到是因为crontab执行的并非当前用户的环境。
三、原因和解决办法
1.原因
没有加载到动态库的原因是crontab 执行任务的时候,并不会缺省的从用户profile文件中读取环境变量参数。从而导致定时任务执行脚本启动程序的时候报错。
2.解决办法
在脚本的开头加上如下两句,让脚本执行环境是当前账户的配置文件。
#!/bin/sh
. /etc/profile
. ~/.bash_profile