Linux学习笔记之五(进程的状态、父子进程、孤儿进程、僵尸进程、守护进程)

1、进程

进程可以简单的理解为一个正在执行的程序,它是计算机系统中拥有资源和独立运行的最小单位。多个进程同时运行从宏观看是并行,从微观上看是串行。举个例子,现有一个CPU以及两个同时运行的线程a和b,CPU实际上是用极小的时间碎片来交替执行a和b,以达到肉眼觉得CPU在同时执行两个进程的效果。
在这里插入图片描述
进程有三个基本状态,分别是就绪态、运行态、阻塞态。顾名思义,就绪态就是进程万事俱备只等CPU来执行它了;运行态便是CPU正在执行该进程;阻塞态是线程还没准备好被CPU执行。当然在这三个状态之上又衍生出许多状态,在1.1的时候有介绍。
在这里插入图片描述
另外,每一个进程都有自己的编号,称之为pid(process identity document)。在进程中可以通过getpid()获得当前进程pid,也可以通过getppid()获得当前进程父进程的pid。

1.1、进程的六种具体状态

  1. 运行状态(Running or Ready: R):进程在运行,或者进程准备好被系统调度。也就说这里的"R"状态包含了前文所述的就绪状态,但通常而言我们将两者统称位运行状态。
  2. 睡眠状态(Sleeping: S):此时进程在安静的等待某个事件发生,且此时进程也可以被杀死。
  3. 磁盘休眠状态(Disk sleep: D):不可杀死的睡眠状态。
  4. 停止状态(Stopped: T):该进程被某个信号叫停了,同时它也可以被叫起来继续运行。
  5. 僵尸状态(Zombie: Z):子进程死了,但父进程在忙无法替它收尸,此时子进程进入僵尸状态。
  6. 死亡状态(Dead: X):进程被杀死之后,尸体也成功回收,即资源被回收。

在Linux中,我们可以通过ps指令来查看所以进程的状态。

ps -aux

在这里插入图片描述
STAT即是status的缩写,表明这一行是显示的是进程的状态。可以看到除了R, S, D, T, Z, X之外,还有一些Ss+之类的状态。其中第一个字母的大写"S",表明这个进程处于睡眠状态,紧接着的小写"s"表示这个进程是对应进程组的组长,"+"后表示这个进程运行于后台之中。
最后还有一个问题,我前文讲了进程有三个基本状态,又有六个具体状态,岂不冲突了?其实不然,只是玩了一个文字游戏罢了。就绪态、运行态、阻塞态是进程的三种基本状态,所谓基本,便是指其重要但并不全面。进程的六个状态才能全面的体现进程状态种类。而基本状态的阻塞态也被具体的拆分为睡眠状态、磁盘休眠状态、停止状态。

1.2、创建子进程

man 2 fork

在这里插入图片描述
可以看到通过以下代码便可以创建一个子进程。

pid_t pid fork();

返回值:成功则返回子进程的pid,失败则返回负值。

用fork创建的子进程会和父进程执行同一个可执行文件,但子进程会从fork函数之后才开始执行。如图所示:
在这里插入图片描述
这里值得注意的是,程序的编译会经历四个步骤,即预处理、编译、汇编、链接。只有经过这四个步骤之后程序才会变成一个可执行文件,而由于这四个步骤会处理好程序的各种变量、头文件、宏定义等内容,所以不会导致子进程从fork开始执行下去会因为缺少一些变量定义之类的而产生报错。

1.3、添加子进程任务

如果仅仅使用fork让子进程执行父进程的代码,这将使子进程显得毫无意义,而为了给子进程添加新的任务,exec函数族便被发明出来。从说明书可以看到exec有六个函数。

man execl

在这里插入图片描述
比较常用的使execl,通过用execl函数让子进程去执行其他的可执行文件,以达到给子进程添加新任务的目的。其函数原型长这样:

int execl(const char *path, const char *arg, ... /* (char *) NULL*/);

它的参数应当如何设置,我先直接贴一段manual的原文上来。

The  const  char *arg and subsequent ellipses in the execl(), execlp(),and execle() functions can be thought of  as  arg0,  arg1,  ...,  argn.
Together  they  describe  a list of one or more pointers to null-terminated strings that represent the argument list available  to  the  executed  program.  
The first argument, by convention, should point to the filename associated with the file being executed.  
The  list  of  arguments  must be terminated by a null pointer, and, since these are variadic functions, this pointer must be cast (char *) NULL.

这段话大概的意思是,execl可以有无数个参数,具体取决了即将调用的可执行文件的需要。但除了char *path之外的第一个参数是可执行文件的名字,最后一个参数是NULL。

char *path:可执行文件所在的目录(包含可执行文件的名字)。
char *arg1:可执行文件的名字。

char *argn:NULL

比如我们想在子进程中执行ls。execl可以这个写:

execl(/bin/ls”,“ls”,NULL);		//仅列出当前目录可见文件
execl(/bin/ls”,“ls”, "-l", NULL);		//列出当前目录可见文件详细信息
execl(/bin/ls”,“ls”, "-i", "-l", NULL);		//显示文件的inode信息
...

在这里插入图片描述

为什么父进程的getpid()和子进程getppid()得到的值不一样,可以参考下面这篇文章:父进程中getpid()值与子进程中getppid()值不相同的问题及解释

1.4、孤儿进程、僵尸进程、守护进程

  • 孤儿进程(Orphan process):父进程已经结束,子进程还在继续执行。但由于子进程需要父进程来帮助其释放资源,所以孤儿进程会被托管在 i n i t init init进程之下。
  • 僵尸进程(Zombie process):子进程已经结束,但父进程还在运行,且此时父进程无法去帮助子进程释放资源,即父进程没有读到子进程的exit()函数。导致子进程死了无人收尸,故被称之为僵尸进程。
  • 守护进程(Daemon process):一些脱离于终端,且不与用户交互的后台进程叫做守护进程。它们的存在至关重要,在背后维护着系统或某个软件、程序正常运行。下图红框内就基本是Windows系统的守护进程。
    在这里插入图片描述

1.4.1、避免僵尸进程

以上这三种进程中,孤儿进程是可以成为进入守护进程的前提,而守护进程又在许多情况下挥发巨大的作业,那么只剩下僵尸进程是程序不愿意看到的。
避免僵尸进程可以用wait系列函数函数,我们来看看它的函数说明:

man 2 wait

在这里插入图片描述
使用wait()函数得先理清一些概念:

  1. 父进程一般不执行其他任务,它的存在就是为了生出一堆子进程,再派子进程去执行具体任务,然后如果子进程死亡了,父进程再去替它们收尸。
  2. 子进程死亡之后会向父进程发送一个SIGCHILD信号,请求父进程为自己收尸(回收资源),以避免自己成为僵尸进程。
  3. wait()函数的出现就完美的满足父进程只生娃、收尸、不干事的需求,当父进程调用这个函数之后就进入阻塞状态,只有在子进程死后发送SIGCHILD信号,父进程才会醒过来去收拾子进程的资源。

wait的函数原型是:

pid_t wait(int *status);

当调用wait()函数,父进程会自动检查子进程的状态,无需我们再干预。

int *status:是一个32位的整形数据,其中包含了退出码、终止信号等信息。通常通过一些宏函数来读取status中的具体信息。当然,如果你压根不想要读取这些信息,只想默默收尸走人,那这个参数可以是NULL。
返回值:如果成功,则返回子进程的pid,反之返回-1。

读取status的宏:

  • WEXITSTATUS:在进程正常退出的情况下读取status中的退出码并将其返回。如果退出码是负数,则用255去加这个负数。(退出码即exit(code)中的code)
  • WIFEXITED:通过解析status判断进程是否为正常退出,若是则返回1,否则返回0。

此外,还有waitpid,waitid等函数,前者常用于等待回收某个具体的子进程,后者我也不太懂了。。。
贴一段代码来看看wait怎么用:

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>

int main()
{       
	pid_t pid = fork();     //create a child process

	if(pid)
	{       
		int status;
		wait(&status);		//waiting for the child to terminate and recliam its resources
		if(WIFEXITED(status))
		{       
			printf("The exit code is: %d\n", WEXITSTATUS(status));
		}
		exit(0);
	}
	else
	{       
		printf("This is the child process.\n");
		sleep(2);
		_exit(0);			//recommend use the _exit() to exit in the child process
	}
	return 0;
}

1.4.2、创建守护进程

前文提到,守护进程是托管在 i n i t init init下的子进程,且脱离控制终端独立运行于后台。由此引出创建一个守护进程的两个必要步骤:

  1. 使用fork()创建一个新的进程,然后在父进程中使用exit()退出。该步骤可以让子进程变成孤儿进程,进而被init进程托管。
  2. 在子进程中使用setsid()函数。该函数可以让子进程脱离原来的进程组和会话,进入一个全新的会话中去。这有这样,该进程才能脱离原来的控制终端。

这两个步骤使创建一个守护进程的必要步骤,再次也先暂停下来解释何为进程组和会话。
所谓进程组,顾名思义就是许多个进程组成的一个小组,该小组的id(Group Identity Document: GID)就是小组组长的pid。接着,会话中又会聚集了许多个小组,同理,会话id(Session Identity Dccument: SID)便是作为翘楚的进程组id(GID)。一般而言,一个会话使用一个控制终端,不过也有特殊,比如对于为守护进程所创建的新会话,我们不希望它有一个控制终端。
注:控制终端就是我们敲命令行的那个窗口,也称终端或终端窗口。在Ubuntu中直接叫terminal(终端),一个terminal对应一个shell进程。而shell是一个解释器,为终端和系统之间的交互提供桥梁。参考:link
在这里插入图片描述
接下来,添加几个步骤让讲守护进程的更具备撸棒性(robust)。

  1. 通过chdir()把当前的工作目录改成根目录。
  2. 重设文件掩码(umask),一般设为0。
  3. 关闭文件描述符,由于文件描述符是内核空间返回给应用层的一个文件“代号”,然而在守护进程中我们并不希望再与应用层产生联系,所以关闭文件描述符可以节省资源。
  4. 在子进程中再套一个进程,防止会话建立新的控制终端。

最后,就可以在守护进程中添加我们需要执行的代码了。

1.4.3、杀死守护进程

守护进程一般生命周期比较长,由于其脱离了控制终端,所以想要关闭守护进程只能等到系统完全关闭或者手动杀死它。比如用kill:

kill -9 [the pid of the daemon process]

1.5、综合练习

本次练习任务:

  1. 创建一个父进程和一个子进程,并分别打印这两个进程的pid。
  2. 在父进程离开后,打印此时托管子进程的进程的pid。
  3. 创建一个守护进程,要求更改其目录,关闭文件描述符号,修改文件掩码。
  4. 最后从控制终端杀死这个守护进程。
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>

int main()
{
        pid_t pid = fork();
        if(pid) 								//enter the parent process
        {
                printf("the pid of the parent processs is: %d.\n",getpid());
                exit(0);
        }
        else    								//enter the child process
        {
                sleep(1); 						//waiting for the parent process to terminate
                printf("the pid of the child processs is: %d, and parent is: %d. \n",getpid(),getppid());
                setsid();     		//create and enter a new session
                chdir("/");     				//change the working directory
                umask(0);       				//change the umask
                for(int i=0;i<3;i++){close(i);} //close the file descriptor
                while(1)
                {
                	//you can put any programs you like into this field.
                }
        }
        return 0;
}

输出结果是:

the pid of parent process is: 2600.
the pid of child process is: 2601, and its parent is: 1420.

可以看到子进程的父进程已经和原来创建它的父进程pid不一样了,我们通过搜索看看是谁托管了这个子进程。

ps -aux | grep 1420

在这里插入图片描述
可以看到是init进程托管了这个子进程。此外,当该孤儿进程使用setsid()函数变成守护进程之后,如果再使用printf()之类的函数将失去效果。因为守护进程没有其对应的控制终端,自然无法让printf()发挥作用。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

__TAT__

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值