Linux——进程控制:创建、终止、等待、替换

进程创建

fork

#include <unistd.h>
pid_t fork(void);

操作系统做了什么?

调用fork之后,内核的工作:

  1. 分配新的内存块和内核数据结构给子进程
  2. 将父进程部分数据结构内容拷贝至子进程
  3. 添加子进程到系统进程列表当中
  4. fork返回,开始调度器调度

进程 = 内核数据结构 + 代码和数据

创建子进程的过程就是:创建子进程的内核数据结构,即task_struct + mm_struct + paper_table等等,继承父进程的代码,同时拷贝数据。

fork之后,操作系统会create一个新的process,copy_process,copy_mem,把父进程的所有资源(包括代码段,数据段、堆栈数据等),以及寄存器的值继承给子进程。之后再以写时拷贝的形式保证进程的数据独立性。

do_fork

int sys_fork(struct pt_regs *regs)
{
    return do_fork(SIGCHLD, regs->sp, regs, 0, NULL, NULL);
}

asmlinkage int sparc_do_fork(unsigned long clone_flags,
                             unsigned long stack_start,
                             struct pt_regs *regs,
                             unsigned long stack_size)
{
    unsigned long parent_tid_ptr, child_tid_ptr;
    unsigned long orig_i1 = regs->u_regs[UREG_I1];
    long ret;
    parent_tid_ptr = regs->u_regs[UREG_I2];
    child_tid_ptr = regs->u_regs[UREG_I4];
    ret = do_fork(clone_flags, stack_start,
              regs, stack_size,
              (int __user *) parent_tid_ptr,
              (int __user *) child_tid_ptr);
    /* If we get an error and potentially restart the system
     * call, we're screwed because copy_thread() clobbered
     * the parent's %o1.  So detect that case and restore it
     * here.
     */
    if ((unsigned long)ret >= -ERESTART_RESTARTBLOCK)
        regs->u_regs[UREG_I1] = orig_i1;
    return ret;
}

fork返回之后,两个进程的PC指针都指向fork函数之后的代码,但实际上是父子进程共享了整个代码。子进程运行的时候是从pc指针中取值得到下一次运行的代码的地址。
当然,子进程完全可以通过goto等方法让执行流回到fork之前的地方。

一个有趣的现象

#include <stdio.h>
#include <unistd.h>
#include <cstdlib>

int main()
{
  printf("我是父进程,我要来执行fork了\n");
  pid_t id = fork();

again:  printf("这是fork之后的代码,子进程跳转后才能访问到的\n");

  if(id == 0)
  {
    printf("我是子进程 pid = %d, ppid = %d\n",getpid(), getppid());
    for(int i = 0; i < 3; i++)
      sleep(1);
      
    printf("子进程要跳转了\n");
    goto again;
    exit(1);
  }
  while(1)
  {
    printf("我是父进程 pid = %d, ppid = %d\n",getpid(), getppid());
    for(int i = 0; i < 3; i++)
    {
      sleep(1);
    }
    break;
  }
  return 0;
}


Ctrl+C杀掉进程后,命令行开始提供服务,过了一会还会继续打印?这里看起来是Ctrl+C不起作用
这不难理解,./a.out之后,运行的是从始至终的父进程,父进程会被杀掉,但是子进程还在一直运行。父进程挂掉之后,shell继续提供服务,但是子进程还在向显示器打印。要用kill命令发送信号杀掉子进程,子进程会进入终止态,但是因为父进程早就挂掉了,所以子进程会被init领养,之后被回收资源。


进程终止

进程退出

进程退出的场景:运行完毕,结果正确;运行完毕,结果不正确;运行没完毕,被终止。
echo $?命令可以查询最近一次进程执行完毕时对应进程的退出码,退出码是一个8位无符号数。

main函数为什么要return,return给谁,为什么是0?
为了向操作系统或者其他程序报告自己的运行状态。
函数的返回值为0表示成功,因为成功只有一个标志就行,不需要知道原因,失败可以有无数个原因。
例如STM32开发中调用MPU6050的DMP库的初始化函数,如果不成功会有多种错误原因,用正整数可以标识。

如何终止进程?

#include <unistd.h>
void _exit(int status);
void exit(int status);

正常终止

  1. 在main函数中return
  2. 用exit或者_exit函数
    区别:exit会终止进程且刷新缓冲区,但是_exit不会。
    调用exit,系统会关闭所有打开的流,刷新缓冲区,之后再调用_exit。

虽然status是int,但是操作系统会把int转换成uint,因为退出码的范围是0-255。所以exit(-1)时,echo $? 结果是255。

异常终止

如收到信号。


进程等待

为什么要等待?

如果子进程退出,父进程不回收就会变成僵尸进程,操作系统是无法杀死的,可能内存泄漏,除非父进程也结束了,子进程被操作系统领养。因此父进程应该等待子进程,回收子进程的资源,获取其退出信息,例如退出码。

如何进程等待?

#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int* status);
pid_t waitpid(pid_t pid, int* status, int options);

调用这两个函数,可以从task_struct中拿到进程的退出状态,退出状态是进程退出后仍留在数据结构中的。

wait

  • wait的参数是输出型参数,等待任意一个子进程,并输出退出信息。

waitpid

  • pid:-1表示任意进程,大于0的数表示要等待的进程的pid。
  • status:该进程的退出状态。
  • options:0表示阻塞等待、WNOHANG表示非阻塞等待。
  • 返回值:大于0表示等待成功,并且进程已退出;等于0表示等待成功,但是进程还没有退出。
进程阻塞

调用scanf和cin的时候,没有输入就会一直等待,task_struct的R状态变为S状态,从运行队列转移到等待队列。

非阻塞等待

等待的时候如果事件没就绪就直接返回,执行别的东西,待会再来检查。多次调用费阻塞等待接口的检测行为称为轮询检测

等待的结果

退出码的组成

status的低八位是进程的退出信号,高8位是进程的退出码。当进程被杀死了还会有一个core_dump标志位。

printf("退出信号 = %d, 退出码 = %d\n", (status & 0x7F), (status >> 8) & 0x7F);

例如:当用kill杀死进程的时候,比如kill -9 进程, 进程的低八位就会收到9号信号。
如果一个进程收到信号,就说明进程出现异常,这时候退出码就没用了,因为不是正常退出,所以只关心收到的信号。


进程替换

什么是进程替换?

之前创建进程后,父子进程共享代码。如果想让子进程执行其他逻辑呢?

  1. 进程替换不会创建新进程,因为进程替换只是将该进程的数据替换为指定的可执行程序。而进程PCB没有改变,所以不是新的进程,pid不变。
  2. 进程替换后,如果替换成功则开始执行新程序,原替换函数之后的代码不会执行,因为进程替换是覆盖式的替换,替换成功后进程原来的代码就消失了。如果进程替换失败则会执行原替换函数后的代码。

原理

将磁盘中的别的程序加载到内存中,通过写时拷贝,重新建立页表的映射,将原子进程中数据段和代码段的映射改变为到别的程序的映射,这样父子进程的代码和数据就完全分离了。

进程替换的接口

#include <unistd.h>
int execl (const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char * const envp[]);

int execv (const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);

execl

  • path:用来替换的程序路径:/usr/bin/ls,也可以是相对路径。要执行一个程序,系统需要知道如何执行这个程序,就要带参数:ls -a -l
  • arg:表示可变参数,用于传入选项。以NULL为终止符表示参数传递完毕。
  • 返回值不用判断,因为替换成功不会返回,替换失败将会执行原文件后续代码。
  • 调用方式:execl ("/usr/bin/ls", "ls", "-a", "-l", NULL);

execlp

(p代表环境变量path)

  • file:要替换的程序名,可以是相对路径,也可以在环境变量中搜索。
  • arg:可变参数,跟上面一样。
  • 返回值:不用判断
  • 调用方式:execlp(“./hello”,“./hello” ,NULL);

execv和execvp

跟execl的区别是可变参数变成字符串数组。

char* commands[] = {"./hello", NULL};                                        
std::cout << "我要替换了\n";
execv("./hello",commands);

execle和execve

则是可以自己导入环境变量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值