进程的收尾和替换的技巧：wait和exec函数的作用和使用方法

SummerM.

已于 2023-11-20 19:45:20 修改

阅读量570

点赞数 1

分类专栏： Linux 文章标签： linux php 服务器

于 2023-11-09 23:01:03 首次发布

本文链接：https://blog.csdn.net/weixin_61766635/article/details/134322335

版权

Linux 专栏收录该内容

33 篇文章 0 订阅

订阅专栏

进程的收尾和替换的技巧：wait和exec函数的作用和使用方法

📟作者主页：慢热的陕西人

🌴专栏链接：Linux

📣欢迎各位大佬👍点赞🔥关注🚓收藏，🍉留言

本博客主要内容讲解了进程等待收尾内容和进程的程序替换，以及进程程序替换的原理，进程程序替换的7个重要接口

文章目录

进程的收尾和替换的技巧：wait和exec函数的作用和使用方法

1.进程等待(续)

我们稍微改造一下，之前进程等待的时候，父进程不要阻塞等待的代码，让父进程真正的去运行一些任务。

我们采用函数回调的方式，让父进程在等待子进程的时候也可以去运行自己的一些任务！

#include<stdio.h>
#include<string.h>
#include<unistd.h>
#include<sys/types.h>
#include<sys/wait.h>
#include<stdlib.h>

#define TASK_NUM 10


//预设一批任务
void sync_disk()
{
  printf("这是一个刷新数据的任务\n");
}

void sync_log()
{
  printf("这是一个同步日志的任务\n");
}

void net_send()
{
  printf("这是一个网络发送的任务\n");
}                                                                                                                                                            


//保存相关的任务
typedef void (*func_t)(); //定义了一个函数指针类型
func_t orther_task[TASK_NUM] = {NULL}; 

//装载任务
int Load_Task(func_t fuc)
{
  int i = 0;
  for(; i < TASK_NUM; ++i)
  {
    if(orther_task[i] == NULL) break;
  }

  if(TASK_NUM == i) return -1;
  else orther_task[i] = fuc;

  return 0;
}

//初始化函数指针数组
void Init_Task()
{
  for(int i = 0; i < TASK_NUM; ++i) orther_task[i] = NULL;
  
  Load_Task(sync_disk);  
  Load_Task(sync_log);
  Load_Task(net_send);
}

void Run_Task()
{
  for(int i = 0; i < TASK_NUM; ++i)
  {
    if(orther_task[i] == NULL) continue;
    else orther_task[i]();
  }
}

int main()
{
    pid_t id = fork();
                                                                                                                                                             
    if(id == 0)
    {
      //子进程
      int cnt = 5;
      while(cnt)
      {
        printf("我是子进程，我还活着呢，我还有%dS，我的pid：%d，我的ppid：%d\n", cnt--, getpid(), getppid());
        sleep(1);
      }
      exit(0);
    }

    Init_Task();

    while(1)
    {

      int status = 0;
      pid_t ret_id = waitpid(id, &status, WNOHANG);// 夯住了

      if(ret_id < 0)
      {
        printf("waitpid_error\n");
      }
     else if(ret_id == 0)
      {
        Run_Task();                                                                                                                                          
        sleep(1);
        continue;
      }
      else
      {

      printf("我是父进程，我等待成功了，我的pid：%d，我的ppid：%d, ret_id: %d, child exit code: %d, child exit signal:%d\n",getpid(), getppid(), ret_id, (status >> 8)&0xFF, status & 0x7F);
        exit(0);
      }
      sleep(1); 
    }
  return 0;
}

运行结果：

继续改进，我们之前获取进程退出码的时候是使用(status >> 8)& 0xFF的方式来进行获取的，那么实际上C库也给我们提供了两个宏来帮助我们获取进程的退出码：

status:
WIFEXITED(status): 若为正常终止子进程返回的状态，则为真。（查看进程是否是正常退出）
WEXITSTATUS(status): 若WIFEXITED非零，提取子进程退出码。（查看进程的退出码）

我们用这两个宏来优化一下我们等待成功，也就是子进程结束的时候的代码：

      else                                                                                       
      {                                                                                            
        //等待成功                                                                                   
        if(WIFEXITED(status))                                                       
        {                                                                                         
          //正常退出                                                                                 
          printf("wait success, child exit code :%d", WEXITSTATUS(status));                           
        }                                                                                             
        else 
        {                                                                                             
          //异常退出                                                                                
          printf("wait success, child exit signal :%d", status & 0x7F);    
        }            exit(0);    
      }

正常退出：

异常退出：我们尝试在父进程等待的时候杀掉子进程：

2.进程程序替换

我们为什么需要创建子进程？为了让子进程帮我执行特定的任务；

①让子进程执行父进程的一部分代码；

②如果子进程指向一段全新的代码呢？这时候我们就需要进程的程序替换！

也是为什么需要进程的程序替换。

2.1 程序替换是如何完成的—单线程版

代码：

#include<stdio.h>    
#include<stdlib.h>    
#include<unistd.h>    
    
int main()    
{    
  printf("begin......\n");    
  printf("begin......\n");    
  printf("begin......\n");    
  printf("begin......\n");    
  printf("begin......\n");    
  execl("/bin/ls", "ls", "-a", "-l", NULL);                                                           
  printf("end........\n");    
  printf("end........\n");    
  printf("end........\n");    
  printf("end........\n");    
  printf("end........\n");    
  return 0;    
}

运行结果：

那么我们可以看到这个进程运行了开始的begin....,然后运行了ls,但是后面的end...却不见了。

这是因为发生了进程的程序的替换，简要的原理就是，操作系统通过提供的地址/bin/ls从磁盘中拿出ls然后选到指定的文件ls,在输入一些参数-a, -l，以NULL表示结束。

2.2程序替换的原理

操作系统不动当前进程的内核数据结构，而是去磁盘内部拿到要替换的数据和代码，将我们当前进程的数据和代码替换掉。

当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。

所以进程的程序替换，是没有创建新的进程的。

①站在进程的角度

操作系统，帮我们在磁盘内部找到我们要替换的数据和代码，替换进程的数据和代码。

②站在程序的角度

这个程序被加载了，所以我们也称execl这类函数为加载器。

我们在回到一开始，为什么我们程序后面的end.....却没有打印出来？

原因是当我们加载程序替换的时候，新的数据和代码就进入了进程，当前进程后续没有没运行的代码就成为了老代码，直接被替换了，没有机会执行了。

所以进程的程序替换是整体替换，而不是局部替换。

所以我们接下来引入多进程的程序替换

2.3引入多进程，使用所有程序替换的接口

例程：

#include<stdio.h>    
#include<stdlib.h>    
#include<unistd.h>    
#include<sys/types.h>    
#include<sys/wait.h>    
    
int main()    
{    
    
  pid_t id = fork();    
  if(id == 0)    
  {    
    //child    
    printf("我是子进程：%d", getpid());    
    execl("/bin/ls", "ls", "-a", "-l", NULL);    
  }    
    
  sleep(2);    
  //father    
  waitpid(id, NULL, 0);    
  printf("我是父进程：%d\n", getpid());                                                                                                                      
    
  return 0;    
}

运行结果：

我们看到execl之后父进程的内容也被运行了

因为进程的独立性，所以进程的程序替换只会影响调用程序替换的子进程。

子进程加载新程序的时候，是需要进行程序替换的，发生写时拷贝(子进程执行的可是全新的代码啊，新的代码，所以代码区也可以发生写时拷贝)

那么对于execl这类加载函数，它有没有返回值呢？

答案是分情况：

①替换成功是没有返回值的

②替换失败是有返回值的-1

原因是：假设替换替换成功了，那么我们该进程中的代码和数据，都会被替换成新的代码和数据，那么我们之前的返回值也就不复存在了，并且我们也不需要返回值了。

替换失败的情况下，进程之前的代码和数据还是存在的，那么我们的返回值也是存在的，从而可以返回。

所以我们调用了加载函数之后我们不用去判断它是否加载成功，只需要在函数后面返回异常即可。

失败的例程：

#include<stdio.h>    
#include<stdlib.h>    
#include<unistd.h>    
#include<sys/types.h>    
#include<sys/wait.h>    
    
int main()    
{    
    
  pid_t id = fork();    
  if(id == 0)    
  {    
    //child    
    printf("我是子进程：%d\n", getpid());                                                                                                                    
    execl("/bin/lsss", "lsss", "-a", "-l", NULL);    
    exit(1);    
  }    
    
  sleep(2);    
  //father    
  int status;    
  waitpid(id,&status, 0);    
  printf("我是父进程：%d, child exit signal:%d\n", getpid(), WEXITSTATUS(status));    
    
  return 0;    
}

熟悉所有的替换程序接口(7个)

①int execl(const char *path, const char *arg, ...);

例如：execl("/bin/ls", "ls", "-a", "-l", NULL);

l代表list；

path：路径，也就是告诉操作系统，你要用来替换的程序，在磁盘的哪个路径,例程里的/bin/ls；

arg：文件，是你要用来替换的文件名，例程里面的ls。

其中的...是可变参数列表,例程中的那些参数-a , -l。

其中最后我们要特别的输入一个NULL参数,告诉函数参数结束了；

②int execv(const char *path, char *const argv[]);

相比较第一个函数的差别就是，第一个函数要求我们一个一个的去传参数，而第二个要求我们直接用数组的形式去传，但是原则也是一样的，数组的最后一个元素也要置成NULL。

我们在子进程内部调用的时候是这样的：

先创建一个数组，将这些参数一个一个放进去，再传给execv即可

那么其实v就是vector就是数组的意思；
   char* const argv[] =    
   {    
     "ls",    
     "-a",    
     "-l",    
     NULL    
   };    
  // execl("/bin/lsss", "lsss", "-a", "-l", NULL);    
  execv("/bin/ls", argv);                                                                                                                                 
   exit(1);    
 }    
运行结果：

③int execlp(const char *file, const char *arg, ...);

p:当我们指定执行程序的时候，只需要指定程序名即可，系统会自动在**环境变量PATH**中查找。

也就是说我们要用于替换的程序，必须在环境变量PATH中，或者说我们在环境变量PATH中设置过；
 execlp("ls", "ls", "-a", "-l", NULL);    
那么其中的两个ls是不一样的，一个是文件名，一个是参数。

④int execvp(const char *file, char *const argv[]);

v:表示参数以数组的形式传入；

p:表示在环境变量PATH中去寻找用于替换的文件；

   char* const argv[] =                                                                                                                                   
   {    
  	"ls",    
   	"-a",    
  	"-l",    
     NULL    
   };    

   execvp("ls", argv);

运行结果：

⑤int execle(const char *path, const char *arg, ..., char * const envp[]);

envp[]:叫做自定义环境变量，当我们不想使用系统默认的环境变量的时候，这个时候我们就传递一个envp

比如我们现在要让我们的调用exec目录下的ortherproc来替换myproc的子进程的后续代码

先用execl尝试一下：
 execl("./exec/ortherproc", "ortherproc", NULL);  
运行结果：

换成的动态的效果再看看：

下来我们尝试用execle来实现一下：

proc.c
   char* const envp[] =                                                                                                             
   {                                                                                                                                
    "MYENVP=UCanCMe!",    
     NULL    
   };    

   execle("./exec/ortherproc", "ortherproc",envp);  
ortherproc.cc
for(int i = 0; i < 5; ++i)      
{      
 cout << "我是另一个程序，我的PID是 ：" << getpid() << endl;      
 cout << "MYENVP: " << (getenv("MYENVP")==NULL ? "NULL" : getenv("MYENVP")) << endl;           cout << "PATH: " << (getenv("PATH") == NULL ? "NULL" : getenv("PATH")) << endl;      
 sleep(1);                                                                     
}     
运行结果：

我们看到自定环境变量打印出来了，但是操作系统内部的环境变量却不见了，所以我们可以得到一个结论：

自定义环境变量覆盖了，默认的环境变量；

我们传默认的环境变量试试：
extern char ** environ;

execle("./exec/ortherproc", "ortherproc",NULL , environ);  
运行结果：

那么如果我们两个都要呢，那么有一个接口putenv给我们提供了一个将自定义环境变量追加到进程的默认环境变量的方法：接下来我们尝试一下
   putenv("MYENVP=UCanCMe");    
   execle("./exec/ortherproc", "ortherproc", NULL, environ);  
运行结果：

插播一段：

我们知道环境变量具有全局属性，可以被子进程继承下去，那么操作系统是怎么办到的？

只需要用execle的最后一个参数传过去即可！

那么我们是不是不需要putenv也能实现两个都能被子进程读取到呢？

我们直接把自定义的环境变量export到bash中试试：
[mi@lavm-5wklnbmaja lesson6]$ export MYENVP=UCanCMe
[mi@lavm-5wklnbmaja lesson6]$ echo $MYENVP
UCanCMe
运行结果：

我们发现是可行的，自定义环境变量-----> bash ----->父进程------>子进程