进程创建
fork函数初识
在linux中fork函数时非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。
#include <unistd.h>
pid_t fork(void);
返回值:自进程中返回0,父进程返回子进程id,出错返回-1
进程调用fork,当控制转移到内核中的fork代码后,内核做:
- 分配新的内存块和内核数据结构给子进程
- 将父进程部分数据结构内容拷贝至子进程
- 添加子进程到系统进程列表当中
- fork返回,开始调度器调度
fork之后,父子进程代码共享:
我们可以看到,Before只输出了一次,而After输出了两次。Before是由父进程打印的,而在之后调用的fork,After由子进程和父进程两个进程执行。
注意: fork之后,父进程和子进程谁先执行完全由调度器决定。
fork返回值
- 子进程返回0
- 父进程返回子进程的pid
为什么fork要给子进程返回0,给父进程返回子进程的pid?
一个父进程可以创建多个子进程,而一个子进程只能由一个父进程。
因此,对子进程来讲,父进程是不需要被标识的;但对于父进程来讲,子进程需要被标识。
为什么fork函数有两个返回值?
父进程调用fork函数后,为了创建子进程,fork函数内进行子进程的进程控制,创建子进程的进程地址空间,创建子进程的页表等等…。
写时拷贝
通常,父子代码共享,父子再不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份副
本。具体见下图:
为什么要进行写时拷贝?
进程具有独立性。多进程运行,需要独享各种资源,多进程运行期间互不干扰,不能让子进程的修改影响到父进程。
为什么不在创建子进程的时候就进行数据拷贝?
子进程不一定会使用父进程的所有数据,子进程不对数据进行写入的情况,没有必要进行拷贝,需要的时候在按需分配,高效利用空间。
fork常规用法
- 一个进程希望复制自己,使子进程同时执行不同的代码段。例如父进程等待客户端请求,生成子进程来处理请求。
- 一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数。
fork调用失败的原因
- 系统中有太多的进程
- 实际用户的进程数超过了限制
进程终止
进程退出场景
- 代码运行完毕,结果正确
- 代码运行完毕,结果不正确
- 代码异常终止
进程退出码
这个所谓的退出信息就是以退出码的形式作为main函数的返回值返回,我们一般以0表示代码成功执行完毕,以非0表示代码执行过程中出现错误,这就是为什么我们都在main函数的最后返回0的原因。
正常终止(可以通过 echo $? 查看进程退出码):
为什么以0表示代码执行成功,以非0表示代码执行错误?
代码执行成功只有一种情况,,而代码执行错误有很多原因,例如栈溢出等等…非零数字的很多种就对应了执行错误的原因。
C语言中strerror函数 可以通过错误码来获取对应的错误信息:
进程正常退出
return退出
最常用的方法:
exit函数
exit函数可以在代码的任何地方退出进程,并且exit在退出进程前会做一系列工作:
- 执行用户通过atexit或on_exit定义的清理函数。
- 关闭所有打开的流,所有的缓存数据均被写入。
- 调用_exit函数终止进程。
例如:exit退出进程前会将缓存区的数据输出。
_exit函数
_exit函数也可以在代码中的任何地方退出进程,但是_exit函数会直接终止进程,并不会在退出进程前会做任何收尾工作。
eg:_exit后,缓存区数据并未输出
进程异常退出
- 向进程发送信号导致进程异常退出:
在进程运行过程中向进程发送kill -9信号使进程异常退出,或者ctrl+c。 - 代码错误导致进程运行时异常退出:
代码当中存在野指针问题使得进程运行时异常退出,或是出现除0的情况使得进程运行时异常退出等。
进程等待
进程等待的必要性
- 子进程退出,父进程如果不读取子进程的退出信息,子进程就会变成僵尸进程,进而造成内存泄漏。
- 进程一旦变成僵尸进程,那么就算是kill -9命令也无法将其杀死,因为谁也无法杀死一个已经死去的进程。
- 对于一个进程来说,最关心自己的就是其父进程,因为父进程需要知道自己派给子进程的任务完成的如何。
- 父进程需要通过进程等待的方式,回收子进程资源,获取子进程的退出信息。
进程等待的方法
wait方法
eg:
我们发现,子进程退出后,父进程读取了子进程的退出信息,子进程并没有变成僵尸进程。
注意: 代码中的WIFEXITED(status)
waitpid方法
用法与wait类似,不做过多解释。
获取子进程status
进程等待所使用的两个函数wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统进行填充。
如果对status参数传入NULL,表示不关心子进程的退出状态信息。否则,操作系统会通过该参数,将子进程的退出信息反馈给父进程。
status是一个整型变量,但status不能简单的当作整型来看待,status的不同比特位所代表的信息不同,具体细节如下(只研究status低16比特位):
在status的低16比特位当中,高8位表示进程的退出状态,即退出码。进程若是被信号所杀,则低7位表示终止信号,而第8位比特位是core dump标志。
我们也可以根据status得到进程的退出码和推出信号:
exitCode = (status >> 8) & 0xFF; //退出码
exitSignal = status & 0x7F; //退出信号
多进程创建以及等待的代码模型
同时创建多个子进程,然后让父进程依次等待子进程退出,这叫做多进程创建以及等待的代码模型。
eg:同时创建10个进程,子进程的pid放入ids数组中,并将10个子进程退出的退出码设置为该子进程pid在数组ids中的下标,然后父进程使用waitpid指定等待这10个进程。
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
int main()
{
pid_t ids[10];
for(int i = 0; i < 10; i++)
{
pid_t id = fork();
if(id == 0){
//child
printf("child process created successfully...PID:%d\n", getpid());
sleep(3);
exit(i);//将子进程的退出码设置为子进程在ids的下标
}
//father
ids[i] = id;
}
for(int i = 0; i < 10; i++)
{
int status = 0;
pid_t ret = waitpid(ids[i],&status,0);
if(ret > 0)
{
//wait success
printf("wiat child success..PID:%d\n", ids[i]);
if(WIFEXITED(status))
{
//exit normal
printf("exit code:%d\n", WEXITSTATUS(status));
}
else
{
//signal killed
printf("killed by signal %d\n", status & 0x7F);
}
}
}
return 0;
}
基于非阻塞接口的轮询检测方案
当子进程未退出时,父进程都在一直等待子进程退出,在等待期间,父进程不能做任何事情,这种等待叫做阻塞等待。
我们可以通过使waitpid的第三个参数potion传入 WNOHANG ,等待的子进程如果没有结束waitpid会直接返回0,不会等待,如果正常结束,则返回子进程的pid。
eg:父进程可以隔一段时间调用一次waitpid函数,若是等待的子进程尚未退出,则父进程可以先去做一些其他事,过一段时间再调用waitpid函数读取子进程的退出信息。
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
int main()
{
pid_t id = fork();
if (id == 0)
{
//child
int count = 3;
while (count--)
{
printf("child do something...PID:%d, PPID:%d\n", getpid(), getppid());
sleep(3);
}
exit(0);
}
//father
while(1)
{
int status = 0;
pid_t ret = waitpid(id,&status,WNOHANG);
if(ret > 0)
{
printf("wait child success...\n");
printf("exit code:%d\n", WEXITSTATUS(status));
break;
}
else if(ret == 0)
{
printf("father do other things...\n");
sleep(1);
}
else
{
printf("waitpid error...\n");
break;
}
}
return 0;
}
父进程每隔一段时间就去看子进程是否退出,如果没有退出,父进程就去干自己的事情,过一段时间再来看看,直到子进程退出。
进程程序替换
替换原理
用fork创建子进程后,子进程执行的是和父进程相同的程序(但有可能执行不同的代码分支),若想让子进程执行另一个程序,往往需要调用一种exec函数。
当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,并从新程序的启动例程开始执行。
进程程序替换时,有没有创建新的进程?
进程替换之后,该进程的PCB,进程地址空间以及页表等都没有改变,只有进程在物理内存上的进程代码和进程数据发生了改变,并没有创建新的进程,替换前后pid并没有改变。
子进程进行进程程序替换后,会影响父进程的代码和数据吗?
不会影响,子进程刚被创建时与父进程共享代码和数据,当子进程进行程序替换,就需要对子进程的代码和数据进行操作,这时与父进程共享的代码和数据进行写时拷贝,之后父子进程的代码和数据分离,所以不会影响。
替换函数
其实有六种以exec开头的函数,统称exec函数:
- #include <unistd.h>`
- int execl(const char *path, const char *arg, …);
- int execlp(const char *file, const char *arg, …);
- int execle(const char *path, const char *arg, …,char *const envp[]);
- int execv(const char *path, char *const argv[]);
- int execvp(const char*file, char *const argv[]);
函数解释
函数理解
这些函数原型看起来很容易混,但只要掌握了规律就很好记。
下图为exec系列函数族之间的关系: