Linux下的进程控制

最新推荐文章于 2024-07-23 17:45:23 发布

bit_Sakura

最新推荐文章于 2024-07-23 17:45:23 发布

阅读量767

点赞数

文章标签： linux 服务器操作系统进程替换

本文链接：https://blog.csdn.net/SAKURAjinx/article/details/129014829

版权

退出码

在编写代码时main函数内部我们通常都使用return 0;结尾，以此标识正常退出。这里的return 0就是所谓的退出码，Linux下也是一样：

看这个小程序，当Add函数返回值是5050时return 0正常退出，当返回值是其它值时return 1标志程序有错误异常退出。

Linux下可以通过 $? 获取退出码。echo $?得到退出码为1.

$?：记录最近一个进程的退出码（注意是进程）。所以第一次echo $?得到的是1，再 echo $? 得到的是0：

如果返回值为0标识正常退出没必要说明原因，但异常退出的话要说明原因哪里有错误。

return 0：正常； return 其它：异常。

退出码必须有对应的文字描述，可以是自定义的，也可以使用系统映射的（不太频繁）。

之前学习C语言的时候就有一个可以打印错误码的函数strerror。

我们来看看Linux系统映射的错误有哪些：

Linux下一共有133条错误返回信息。

终止进程

程序在系统中一般是3种状态：

1、代码运行完结果正确，return 0；

2、代码运行完结果错误，return !0；退出码在这个时候起效果。

3、代码没运行完程序异常，此时退出码无意义。

终止进程的3种方法：

1、main函数中return 终止进程。

2、exit() 可以在任意位置终止进程。

3、_exit()，是库函数exit的底层。

方法一上面已经说过了，先来看一下exit()：

exit() 参数是status状态。在Linux操作系统中以整数代表状态，对应终止进程信息。

exit是库函数，而_exit是系统调用，exit调用的就是底层的_exit，那么两者还有什么区别呢？

来看上面的程序，因为打印的时候没用\n，数据先加载到缓冲区，过了一秒后程序终止打印到显示器上。

如果换成_exit：

我们发现没有任何打印，所以得出结论：

exit函数终止进程，主动刷新缓冲区；_exit 函数终止进程，不会刷新缓冲区。

那么缓冲区在哪也可以大致明确了，既然exit 在上层，而_exit 在下层，并且前者可以刷新后者不能，那么缓冲区就介于两者之间。

进程等待

我们知道僵尸进程对操作系统是有危害的，会长时间占用内存。今天我们来解决一下这个问题，就是用到进程等待。

那么进程等待的原因是：回收子进程资源，获取子进程退出信息。

回收子进程资源

先来看一下操作系统是如何回收子进程资源的：

这里要介绍一个系统调用函数wait:

通过wait接口让父进程等待子进程就能回收子进程资源。

写完程序make编译，分屏，左侧运行可执行程序，右侧执行下面监督脚本：

while :; do ps ajx | head -1 && ps ajx | grep test | grep -v grep; sleep 1; done

在子进程运行期间，父子进程都处于S+状态。

子进程退出后，变为僵尸状态，此时由于父进程在休眠，还没有回收子进程。

然后wait 函数等待子进程，将其资源回收，子进程的僵尸状态就结束了，只剩下父进程在运行。

以上就是wait 的回收过程。

获取子进程退出信息

获取子进程退出信息也有对应的系统调用接口waitpid：

waitpid头文件和wait一样有两个：#include<sys/types.h> #include<sys/wait.h>

参数有3个，第一个是要获取的对应进程pid，你传谁那就等待获取谁，第二个是status，获取退出信息（重点谈论），第三个是option，现在我们默认设为0，表示阻塞等待。

返回值pid_t > 0 则返回的是等待的进程的pid，如果为-1则表示等待失败。

下面我们来看一下waitpid的实际应用，还是以上面的代码为例：

waitpid的返回值没问题，就是子进程pid，但是status的退出信息不对。

这是因为status不是被整体使用的，有自己的位图结构。听起来比较抽象，画个图理解一下：

上面说了，进程退出有3种情况：

1、代码跑完，结果正确；

2、代码跑完，结果错误；

3、代码没跑完，异常。

status就用来表示这三种状态，下图是status的二进制结构：

整数status有32个比特位，我们只关心它的低16个比特位。低位0~6表示进程终止的信号，如果信号是0就表示正常退出，非0就表示异常终止。kill -l 可以查看终止信号：

次低位8~15表示子进程退出状态。如果终止信号为0(正常退出）再对应到子进程退出状态.

下面我们再改一下刚刚写的程序，将进程终止信息和子进程退出状态打印出来。

status & ox7F: 拿到低7位（终止信号），(status >>8) &oxFF: 拿到次低位（退出信号）。

sign number终止信号是0，表示正常退出。child exit code退出信息号是10，错误信息是10(可以自己定义错误信息）。

下面再谈一下僵尸进程。一个子进程退出的时候变成僵尸状态，它的代码和数据是不会被操作系统保留的，但是它的PCB及退出信息会被保留下来，等待被父进程接收。

waitpid是系统调用，系统调用是操作系统级的接口，相当于使用操作系统的代码。status是一个整数，存放子进程的退出信息。父进程检测子进程的退出信息，子进程将保存在PCB中的exit code 和sign number 交给status，通过status拿回来放到&status中。

在获取子进程的退出结果过程中，使用status & ox7F 这样的位操作其实并不方便，操作系统给我们提供了一些宏，下面我们介绍其中两种：

WIFEXITED：当子进程正常退出返回真；

WEXITSTATUS：WIFEXITED返回真，则获取子进程退出码。

下面我们使用这种方式来获取子进程的退出码：

以上是阻塞等待的情况，子进程退出变为僵尸，父进程会一直等待子进程接收它的退出信息，期间不会干其他事情。

还有一种情况是非阻塞等待，父进程会对子进程的状态进行检测，如果子进程没有就绪立即返回不会等待，过一会再检测还是一样，每一次都是一次非阻塞等待，进行多次轮询，期间父进程可以执行其它操作。

非阻塞等待的好处就是不会占用父进程所有资源，期间它可以执行其它操作。

那是不是非阻塞等待比阻塞等待要好呢？————其实这种比较并没有意义，要看具体场景下使用哪一种了，如果父进程没有其它任务就用阻塞等待，现实中往往阻塞等待用的多一点。

进程程序替换

首先问个问题：为什么要创建子进程，有什么目的？

1、想让子进程执行父进程代码的一部分 ------> 执行父进程磁盘代码中的一部分。

2、想让子进程执行一个全新的程序 ------> 让子进程加载磁盘上指定的程序，执行新程序的代码和数据。

其实上述过程就是进程的程序替换。

要么进程的程序替换具体是怎么做到的，我们来看一下。

下面有6个常见函数，可以实现程序替换。

先看一下第一个函数execl，它可以将指定程序加载到内存，让指定进程来执行。

我们知道，要将程序加载到内存首先要找到该程序的位置，环境变量PATH就是帮助我们找到对应程序位置的，这里由函数的第一个参数path来做；

找到位置后执行，指令后带cmd选项，如ls -l,ls -a....这由第二个参数arg来做；

第三个参数 ... 是可变参数列表，在printf、scanf函数中见到过。它也是决定程序怎么执行的。

下面看段代码来了解一下该函数的具体用法：

一开始进程正在运行，execl函数将/usr/bin/ls 加载到内存，并附带-l 等选项执行。也就是将程序替换成了ls -l 执行。

再来看一下execl函数的参数，const char* path传的是对应要加载到内存的程序路径，const char* arg传的是程序执行方法，在命令行怎么执行这里就怎么传，后面还可以添加选项传进来，最后以NULL结尾，所有exec*系列函数都以NULL结尾表示传参结束。

运行结果：

可以看到确实替换了程序，而本来应该在最后打印的process has run done没有打印出来，这是为什么看了下面我们就知道了。

程序替换的原理

程序替换的本质，就是将指定程序的代码加载到指定的位置，覆盖自己原来的数据和代码。

所以现在就可以解释上面的问题了，最后的printf内容没有打印出来是因为程序替换后，原来的数据和代码被新的覆盖了，因此没有显示出来。

如果我们要替换的程序不存在呢？

要替换的程序不存在，execl函数执行失败，不会进程程序替换，还是执行原来的程序。

来看一下execl函数的返回值：

execl 只有在执行错误的时候才有返回值-1，成功的话没有返回值，因为不需要——成功执行会程序替换覆盖后面的代码，那返回值就没有意义了。所以execl函数只要返回了那一定是执行出错了，可以用perror("ececl") 获取错误信息：

当然，在实际操作中不会像上面那样写，我们一般是创建一个子进程来进行程序替换，因为进程是独立的，子进程不会影响父进程。

程序替换成功：

这时终止信号为0，正常退出，退出码为0，程序替换成功。

程序替换失败：

这时终止信号为0，正常退出，退出码为1，程序替换失败。

如何保证子进程程序替换不会影响父进程呢？上面说了是由于进程的独立性保证的，还记得之前说过一个写时拷贝的概念吗？这里是一个道理。

子进程的PCB、代码、数据都是根据父进程拷贝过来的，通过各自的页表映射到物理内存上，对应的数据和代码也都一样。当子进程要改变对应的数据时，操作系统会进行写时拷贝，将对应数据拷贝给另一块空间，让子进程页表指向新的空间，再更改数据，同理代码也是一样，可以写时拷贝，于是这样就保证了进程的独立性，不会互相影响。

其它exec*的函数

上面介绍了execl函数，下面的也类似。

先来看一下execlp函数：

exe：可执行程序； l：list列表，将参数一个一个传入exec*; p : path环境变量，带p字符的函数不需要输入程序的路径，只要传入程序是谁，就能自动在环境变量PATH中自动寻找。

演示：

execlv函数

最后一个v ：vector的意思，该函数相较于上面两个，少了一个参数... 也就是可变参数列表，因为vector代替了它，我们可以将本来要传入可变参数列表的选项放进argv[ ]数组中。

演示：

上面char* const argv_[ ]中报了警告，可以强转成char*类型，也可以先不管。

execvp函数：

显然是上面两者结合，这里演示一种结合main函数的用法。

execvp可以直接使用main函数传入的参数，argv[0]就是当前程序，argv[1]就是当前程序的下一条要替换的程序。怎么执行？从argv[1]处开始执行。

./myexec ls -a -l：要执行后面的ls -a -l

execle函数：

最后一个e：env环境变量，该函数可以自己导入环境变量。

在演示execle之前先来看一下execl函数能不能在调用我们自己写的程序的时候导入自定义环境变量：

在mybin.c中打印3条语句，其中PWD, HOME是系统环境变量，MYENV是自定义环境变量。

可以看到系统环境变量被打印出来了，自定义环境变量显示为null，此时我们想导入自定义环境变量可以使用execle函数。

它的第4个参数envp[ ] 就是给我们传环境变量的。

在数组envp_中放入自定义环境变量，再在函数中传入数组名调用。

我们发现自定义环境变量确实被导入打印了，但是系统环境变量此时却没有导入。

所以这种传参方式只能导入自定义环境变量，对系统环境变量不适用。

那么如何既导入系统环境变量又导入自定义环境变量呢？

environ可以帮助我们得到系统环境变量：

记得外部声明extern一下，否则会报错。

此时系统环境变量是有了，但是自定义环境变量又没了。

我们刚刚不是用envp_[ ]数组导入了吗，那是因为自定义环境变量和系统环境变量没有关系，设置了自定义环境变量里面没有自带系统的，是自己搞出来的一套环境变量。

其实环境变量就算不传，默认子进程也能获取。现在我们既想导入自定义的也想导入系统的，可以使用putenv：

putenv就是将自定义环境变量导入到系统中，environ指向对应的环境变量表。

这样就导入了系统环境变量+自定义环境变量。

execve函数：

查看man手册发现，execve是2号手册，也就是系统调用接口，而刚刚上面讲的所有exec*函数都是3号手册，也就是库函数。实际上确实只有execve是系统调用，其它都是根据它封装而来的，便于用户选择对应函数使用。

这里再提一点：main函数和execl谁先执行的呢？

————有人说，肯定是main函数呀，它是程序执行的入口。其实不是！

我们的程序在执行前要先加载到内存，是如何加载到内存的呢？liinux下就是用到exec*系列的函数！我们 ./程序能够运行其实就是用到exec*函数帮助加载，也叫加载器。

所以显而易见，这里是execl先于main函数执行。main函数也是函数，也要被调用，也要传参。

传参传的是什么？

其实也就是exec*的参数传给main函数，就算我们不主动传环境变量env，main函数也会默认获取。

自己调用自己的程序

上面我们是在调用系统的指令(程序），下面我想调用一下自己写的程序。

首先，除了刚刚的那个程序(调用者)外还要再写一个小程序(被调用者）,在makefile文件中要将依赖关系和方法明确一下，使得两个程序都能被编译运行：

make默认只会执行第一条依赖方法。所以为了让mybin.c和myexec.c都能编译我们在开头加一个依赖关系all，.PHONY特点是总是被执行，所以给出.PHONY:all，再让all依赖于mybin和myexec就能使得两者必定被编译。

在myexec.c中调用execl函数，执行当前路劲下的 mybin可执行程序：

这样就实现了自己调用自己的函数。而且我们不仅可以用execl调用C++写的程序，JAVA、Python也都可以调用。

总之，程序替换可以调用任何后端语言的可执行程序。

自己实现简易shell命令行

结合上面的内容，我们可以自己实现一下shell命令行替换程序的过程。

首先创建makefile和myshell.c文件并建立依赖关系等操作不说了。

vim myshell.c：

首先要打印命令行提示符，因为没有 \n不会立刻刷新缓冲区，所以fflush手动刷新一下。

如何接收输入的命令？————fgets函数：

 #define NUM 1024
 char lineCommand[NUM];

从输入流输入到lineCommand数组中，大小比lineCommand小1，预留空间。获取输入流返回不为NULL，否则失败。

写一个打印查看是否能接收输入命令：

 printf("test :%s\n",lineCommand);

可以接收输入命令，但是多了一条空行，原因是用户输入的时候会按 "回车"，系统换行本来就有一个 \n了，这样就多了一个，所以这里我们去掉最后一个 \n：

命令读取后就是解析的过程了。而解析的过程中需要把一整串字符串命令分割，比如 "ls -l -a"需要分割成3个短字符串 "ls","-l","-a"。

这里要用到字符串分割函数strtok.

以空格为界，先分割第一部分字串，创建指针数组myargv，将对应字串放入指针数组：

myargv[0] = strtok(lineCommand," ");

如果没有字串了，strtok会返回NULL，而myargv[end]也是NULL，所以根据这点就可以用循环实现字符串整体分割：

myargv[0] = strtok(lineCommand," ");
int i = 0;
while(myargv[i++] = strtok(NULL," ");

然后我们测试一下，使用条件编译：

#ifdef DEBUG
    for(int i = 0;myargv[i]; ++i)
{
    printf("myargv[%d]:%s\n",i,myargv[i]);
}
#endif

当不需要测试只保留条件编译时，在-DDEBUG前加 #

最后命令行解释器不会只跑一次，所以将其整个套在死循环中：

完成输入，分析指令后，接下来是执行指令。

这里执行的话用刚刚讲的6个函数进行子进程程序替换。

首先创建进程，如果是子进程就执行程序替换，用exec*系列的哪一个函数呢？

————execvp，该函数第一个参数是const char* file，也就是不需要路径直接说明指令是谁，第二个参数是argv[ ]，和我们这里的myargv[ ]正好适配。

最后父进程等待回收子进程即可，并且不需要关心退出信号。

运行一下：

内建命令

在该环境下执行cd命令时，发现路径不会改变：

首先要了解一个东西叫当前路径和工作路径：

写一个简单的程序，运行起来查看它的信息：

ls -al /proc/7440：proc文件系统是动态从系统内核读出所需信息的，现在查看7440进程系统内存信息，有两个引人注目的文件：cwd 和 exe.

exe我们都知道，是可执行的意思。它告诉用户当前进程执行的是磁盘路径下的哪一个文件。

cwd则是当前工作目录，它就是当前路径。默认在哪个路径下执行某个进程，那它的工作目录就是当前所在路径。并且它可以被修改，用到chdir函数：

在刚刚写的小程序开头调用chmir函数，修改对应路径：

再次ls -al proc/10136：

我们发现工作目录确实改变了。

那这和我们简易实现的shell中cd有什么关系呢？

我们fork进程，子进程执行cd命令，子进程有自己的工作目录，cd更改的是子进程的目录，而子进程执行完了就被回收了，shell(父进程）继续运行下去，所以工作目录不会变。

现在我想在myshell.c程序中改变cd的路径：

如果输入不为空并且输入指令是cd，cd 目录也不为空，就改变工作目录，改完后继续执行当前程序。

像cd命令，不创建子进程，让shell自己执行对应的命令，本质就是执行系统接口。

像这种不需要我们自己来执行，而是让shell来执行的命令，叫做内建 / 内置命令。

也就是由 Bash 自身提供的命令，而不是文件系统中的某个可执行文件。

比如之前说的echo之所以能打印非系统环境变量，也是因为它是内建命令。

bit_Sakura

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Linux下的进程控制

当子进程要改变对应的数据时，操作系统会进行写时拷贝，将对应数据拷贝给另一块空间，让子进程页表指向新的空间，再更改数据，同理代码也是一样，可以写时拷贝，于是这样就保证了进程的独立性，不会互相影响。我们fork进程，子进程执行cd命令，子进程有自己的工作目录，cd更改的是子进程的目录，而子进程执行完了就被回收了，shell(父进程）继续运行下去，所以工作目录不会变。一个子进程退出的时候变成僵尸状态，它的代码和数据是不会被操作系统保留的，但是它的PCB及退出信息会被保留下来，等待被父进程接收。
复制链接

扫一扫