如何保证服务一直运行?如何保证即使服务挂掉了也能自动重启?在写服务程序时经常会碰到这样的问题。
shell脚本
下面的shell通过一个while-do循环,用ps -ef|grep 检查loader进程是否正在运行,如果没有运行,则启动,这样就保证了崩溃挂掉的进程重新被及时启动。
必须注意两点:
1、ps |grep 一个进程时必须加上其路劲,否则容易grep到错误的结果;
2、必须用 -v 从结果中去除grep命令自身,否则结果非空。
echo "Current DIR is " $PWD
while [ 1 ]
do
propserverpid=`ps -ef|grep propserver|grep 6668|grep -v grep|awk '{print $2}'`
if [ "$propserverpid" ]
then
echo "propserver is running,pid is " $propserverpid
kill -9 $propserverpid
else
echo "propserver is down ,now starting ..."
nohup $PWD/propserver -c config.ini -p 6668 &
sleep 5
done
如果启动此shell时发现进程已经存在,说明以别的方式启动了进程而不是此shell,那么它会持续提醒找到进程,解决办法是,要么只用此shell启动服务,要么一经发现以其他方式启动的服务即kill掉,上面的语句就是这么干的:
另外运行脚本是老是提示这个错误:
: bad interpreter: 没有那个文件或目录
查了下解释如下
这种情况常见于通过windows平台传递shell脚本,导致bash编码出错,但这次是两台linux服务器通过ftp来传递的,应该不会出现这种问题,算了不管~问题出现了就先解决!
解决方法:
废话少说,直奔主题!
1.在新服务器中新建shell脚本文件。
# vi jobak
2.将原来服务器上的shell脚本的内容复制到刚刚创建的脚本文件,保存退出。
3.修改shell脚本的执行权限属性等等,这个自由发挥。
exec+fork方式
笔者最终采用的exec+fork方式来实现的,具体思想如下:
1,exec函数把当前进程替换为一个新的进程,新进程由path或file参数指定。可以使用exec函数将程序的执行从一个程序切换到另一个程序;
2,fork函数是创建一个新的进程,在进程表中创建一个新的表项,而创建者(即父进程)按原来的流程继续执行,子进程执行自己的控制流程;
3,wait 当fork启动一个子进程时,子进程就有了它自己的生命周期并将独立运行,我们可以在父进程中调用wait函数让父进程等待子进程的结束;
相信介绍到这里,读者已经能够想到解决方法了:1)首先使用fork系统调用,创建子进程,2)在子进程中使用exec函数,执行需要自动重启的程序,3) 在父进程中执行wait等待子进程的结束,然后重新创建一个新的子进程。
使用方法:
#./portmap 需要监控的程序的路径 #args portmap 需要的参数 $ ./supervisor ./portmap args.....
代码如下:
#include <stdio.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <stdlib.h>
int
main(int argc, char **argv)
{
int ret, i, status;
char *child_argv[100] = {0};
pid_t pid;
if (argc < 2) {
fprintf(stderr, "Usage:%s <exe_path> <args...>/n", argv[0]);
return -1;
}
for (i = 1; i < argc; ++i) {
child_argv[i-1] = (char *)malloc(strlen(argv[i])+1);
strncpy(child_argv[i-1], argv[i], strlen(argv[i]));
child_argv[i-1][strlen(argv[i])] = '/0';
}
while(1){
pid = fork();
if (pid == -1) {
fprintf(stderr, "fork() error.errno:%d error:%s/n", errno, strerror(errno));
break;
}
if (pid == 0) {
ret = execv(child_argv[0], (char **)child_argv);
//ret = execl(child_argv[0], "portmap", NULL, 0);
if (ret < 0) {
fprintf(stderr, "execv ret:%d errno:%d error:%s/n", ret, errno, strerror(errno));
continue;
}
exit(0);
}
if (pid > 0) {
pid = wait(&status);
fprintf(stdout, "wait return");
}
}
return 0;
}