一、 概念
守护进程通常是指linux服务器的后台服务进程,它是一个生存期较长的进程,通常独立于控制终端并且周期性执行某种任务或者等待处理某些发生的事件。守护进程通常在系统引导装入时启动,在系统关闭时终止。
linux中,每一个与用户交互的界面称为终端,每一个从此终端启动的进程都会依附于这个终端,这个终端被称为这些进程的控制终端,当控制终端关闭时,依附于该终端的进程也会自动关闭,但是守护进程却能够突破这个限制,它从被执行开始运转,直到整个系统关闭时才退出。
二、创建守护进程
由于守护进程的特殊性,程序需要经过下面处理:
1. 创建子进程,父进程退出;
由于守护进程是脱离控制终端的,通过创建子进程后父进程退出、之后的所有工作都在子进程中完成这种方式,来营造程序已经完毕的假象,用户在shell终端里可以执行其他命令。在Linux中,由于父进程先于子进程退出,子进程将成为孤儿进程,此时会由1号进程(init)收养,原先的子进程就会变成init进程的子进程。
2. 在子进程中创建新会话;
这个步骤是创建守护进程中最重要的一步,虽然它的实现非常简单,但意义却重大,只需要调用setsid()即可。
- 进程组:是一个进程或多个进程的集合,通常它与同一个作业相关联,可以接收来自同一终端的各种信号。每个进程组有一个唯一的进程组ID,每个进程组都可以有一个组长进程,组长进程的标识是,其进程组ID等于其进程ID。组长进程可以创建一个进程组,创建该组中的进程,然后终止。只要在某个进程组中有一个进程存在,则该进程组就存在,这与其组长进程是否终止无关。从进程组创建开始到其中最后一个进程离开为止的时间敬意称为进程组的生存期。进程组中的最后一个进程可以终止,或者转移到另一个进程组。一个进程只能为它自己或者它的子进程设置进程组ID(调用setpgid(pid_t pid, pid_t pgid) ), 在它的子进程调用了exec函数之后,它就不能改变该子进程的进程组ID,在大多数作业控制shell中,在fork之后调用此函数,使父进程设置其子进程的进程组ID,并且使子进程设置其自己的进程组ID。
- 会话:是一个或多个进程组的集合。通常由shell的管道线将几个进程编成一组,成为一个进程组。通常一个会话开始于用户登陆,终止于用户退出,在此期间该用户运行的所有进程都属于这个会话期。
进程调用pid_t setsid(void)函数创建一个新会话。如果调用此函数的进程不是一个进程组的组长,则此函数就会创建一个新会话,可以让进程摆脱原会话的控制,让进程摆脱原进程组的控制,让进程摆脱原控制终端的控制:
a. 该进程变成新会话首进程(session leader)(会话首进程是创建该会话的进程),此时,该进程是新会话中唯一一个进程。会话首进程ID也被视为会话ID。
b. 该进程成为一个新进程组的组长进程,新进程组ID是该调用进程的进程ID。
c. 该进程没有控制终端,如果在调用setsid之前该进程有一个控制终端,那么这种联系也会被中断。
如果该调用进程已经是一个进程组的组长,则此函数返回出错。为了保证不会发生这种情况,通常先调用fork,然后使其父进程终止,而子进程继续。因为子进程继承了父进程的进程组ID,而其进程ID则是新分配的,两者不可能相等。
由于在调用fork函数时,子进程继续了父进程的会话期、进程组、控制终端等,即使父进程退出,但这些属性也不会发生改变,需要调用setsid函数能够使用进程完全独立开来。
3.更改当前目录为根目录;
使用fork创建的子进程继承了父进程的当前工作目录,由于在进程运行中,当前目录所在的文件系统(如/mnt/usb)是不能卸载的,这对以后的使用会造成诸多的麻烦(比如系统由于某种原因要进入单用户模式)。因此,通常的做法是让“/”作为守护进程的当前工作目录,这样可以避免上术问题。
4 . 重设文件权限掩码;
文件权限掩码是指屏蔽掉文件权限的对应位。,比如,有个权限掩码是050,它就屏蔽了文件组拥有者的可读与可执行权限,由于使用了fork函数新建的子进程继承了父进程的文件权限掩码,这就给该子进程使用文件带来了诸多麻烦,因此,把文件权限掩码设置为0,可以大大增强该守护进程的灵活性。
5 . 关闭文件描述符;
同文件权限掩码一样,用fork函数新建的子进程会从父进程那里继承一些已经打开了文件,这些被打开的文件可能永远不会被守护进程读写,但它们一样消耗系统资源,而且可能导致所有的文件系统无法卸下。
6 .守护进程退出处理;
当用户需要外部停止守护进程运行时,往往会使用kill命令停止该守护进程,所以守护进程中需要编码来实现kill发出的signal信号处理,达到进程正常退出。
三、 样例
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <signal.h>
#include <sys/param.h>
#include <sys/types.h>
#include <sys/stat.h>
void init_deamon(void)
{
int pid;
int i;
/* 处理SIGCHLD信号。处理SIGCHLD信号并不是必须的。但对于某些进程,特别是服务器进程往往在请求到来时生成子进程处理请求。如果父进程不等待子进程结束,子进程将成为僵尸进程(zombie)从而占用系统资源。*/
if(signal(SIGCHLD,SIG_IGN) == SIG_ERR){
printf("Cant signal in init_daemon.");
exit(1);
}
if(pid=fork())
exit(0);//是父进程,结束父进程
else if(pid< 0){
perror("fail to fork1");
exit(1);//fork失败,退出
}
//是第一子进程,后台继续执行
setsid();//第一子进程成为新的会话组长和进程组长
//并与控制终端分离
if(pid=fork())
exit(0);//是第一子进程,结束第一子进程
else if(pid< 0)
exit(1);//fork失败,退出
//是第二子进程,继续
//第二子进程不再是会话组长
for(i=0;i< getdtablesize();++i)//关闭打开的文件描述符
close(i);
chdir("/tmp");//改变工作目录到/tmp
umask(0);//重设文件创建掩模
return;
}
/* name :test.c
* function :调用init_deamon函数使进程变成守护进程,然后每个一秒向/tmp目录下的print_time文件打印当前时间
* */
#include <stdio.h>
#include <time.h>
void init_deamon(void);//守护进程初始化函数
void main()
{
FILE *fp;
time_t t;
init_deamon();//初始化为Daemon
while(1)//每隔一分钟向test.log报告运行状态
{
sleep(1);//睡眠一秒钟
if((fp=fopen("print_time","a")) >=0)
{
t=time(0);
fprintf(fp,"The time right now is : %s",asctime(localtime(&t)));
fclose(fp);
}
}
return;
}
四、 与僵尸进程的区别
linux中还有一种进程叫做僵尸进程,一个进程结束了,但是其父进程没有等待他(wait/waitpid),那么该进程就会成为僵尸进程,但是如果该进程的父进程已经先结束,那么该进程就不会变成僵尸进程,因为每个进程结束的时候,系统都会扫描当前系统中运行的所有进程,看有没有哪个进程是刚结束的这个进程的子进程,如果是的话,就由init进程来接管它,成为它的父进程。
一个进程在调用exit结束自己的生命的时候,内核会释放该进程所有的资源,如打开的文件、占用的内存等,但它并没有销毁,而是留下一下称为zombie僵尸进程的数据结构,包括进程号、退出状态、运行时间等,直到父进程通过wait/waitpid来获取时才释放。如果进程不调用wait/waitpid的话,那么那段保存的数据结构就不会释放,其进程号就会一直被占用,但是系统的进程号是有限的,如果产生大量的僵尸进程,将因为没有可用的进程号而导致系统不能产生新的进程,此即为僵尸进程的危害。可以通过如下方式避免产生僵尸进程:
- 父进程通过wait/waitpid等函数等待子进程结束;
- 如果父进程忙,可用signal函数为SIGCHLD安装handler,在该回调函数中调用wait回收,因为子进程结束时会产生SIGCHLD信号告知父进程;
- 如果父进程不关心子进程什么时候结束,可以signal(SIGCHLD, SIG_IGN)通知内核,自己对子进程不感兴趣,那么子进程结束后, 内核会回收, 并不再给父进程发送信号。
- 还有一种技巧,fork两次,父进程fork一个子进程继续工作,子进程再fork一个孙进程然后退出,那么孙进程被init进程接管,那么孙进程结束后内核会回收,不过子进程的回收还要自己做。