进程创建
fork
功能:
从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程
函数原型:
#include <unistd.h>
pid_t fork(void);
返回值:
子进程中返回0,父进程返回子进程的id,出错返回-1
进程调用fork,当控制转移到内核中的fork代码后,内核做以下步骤:
1、分配新的内存块和内核数据结构给子进程
2、将父进程部分数据结构内容拷贝至子进程
3、添加子进程到系统进程列表当中
4、fork返回,开始调度器调度
写时拷贝
通常,父子进程代码共享,父子进程不再写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式拷贝一份儿副本进行数据修改
常规用法:
一个父进程希望赋值自己,是父子进程同时执行不同的代码段。例如:父进程等待客户端请求,生成子进程来处理请求
一个进程要执行一个不同的程序。例如子进程从fork返回后,调用进程替换函数
vfork
虽说vfork()函数已经逐渐不再使用,因为fork()的写时拷贝取代了它的作用,但是作为了解,这里会简单的介绍一下:
vfork()函数作用:
创建子进程,子进程和父进程会共用同一份虚拟地址空间,若是同时执行不同的逻辑、写入等操作,会引起函数调用栈混乱,所以vfork()创建子进程后会阻塞(挂起)父进程,直到子进程调用exit()等函数退出或者进行程序替换。
【注意】:vfork()函数创建出来的子进程不能再main()函数中return退出,因为释放资源后,父进程会陷入混乱而出错
fork()和vfork()函数在内核中都是调用clone()克隆函数来实现进程的创建
进程终止
进程退出场景
1、代码运行完毕,结果正确
2、代码运行完毕,结果不正确
3、代码异常终止
进程常见退出方法
正常退出
可以使用 echo $? 查看进程退出码
1、从main函数返回
2、调用库函数exit()
3、调用系统调用接口_exit()
异常退出
ctrl + c //信号终止
系统调用接口_exit()
#include <unistd.h>
void _exit(int status);
参数:status定义了进程的终止状态,父进程通过wait来获取该值
【注意】:返回结果status只用一个字节保存,能表示的范围为0~255
虽然status是int类型,但是仅有低8位可以被父进程所用。所以_exit(-1)时,在终端查看上一进程/程序返回结果是,会发现输出的是255
库函数exit()
#include <unistd.h>
void exit(int status);
有如下例子:
#include <stdio.h>
#include <unistd.h>
int main()
{
printf("hello world");
_exit(0);
}
运行结果:
[adam_xi@localhost test]$ ./a.out
[adam_xi@localhost test]$
int main()
{
printf("hello world");
exit(0);
}
运行结果:
[adam_xi@localhost test]$ ./a.out
hello world[adam_xi@localhost test]$
exit()在底层会调用_exit(),但在调用_exit()之前,还会:
1、执行用户定义的清理函数
2、关闭所有打开的流,所有的缓存数据均被写入
3、调用_exit()
return退出
return是一种更为常见的进程退出方法,执行return n等同于执行exit(n),因为调用main的运行时函数会将main的返回值当做exit()的参数
进程等待
目的
1、为了避免僵尸进程的产生
2、父进程需要获取进程的运行结果和退出信息
方法
wait()
#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int *status);
参数:输出型参数,获取子进程退出状态,不关心可以设置为NULL
返回值:若成功,返回被等待进程的pid
若失败,返回-1
功能:
等待任意一个子进程的退出,如果当前没有子进程退出,则一直等待(阻塞式等待)
waitpid()
#include <sys/types.h>
#include <sys/wait.h>
pid_t waitpid(pid_t pid, int *status, int options);
参数:
pid:
pid = -1:等待任一个子进程的退出
pid > 0:等待期进程ID与pid相等的子进程
status:
WIFEEXITED(status):若为正常终止子进程返回的状态,则为真(查看进程是否正常退出)
WEXITSTATUS(status):若WIFEEXITED非零,提取子进程退出码(查看进程的退出码)
options:
0:阻塞式等待子进程退出
WNOHANG:非阻塞式等待子进程退出:若pid指定的子进程没有结束,则wiitpid()函数返回0,不予以等待;若正常结束,则返回该子进程的id
获取子进程status
wait()和waitpid(),都有一个 status参数,该参数是一个输出型参数,由操作系统填充
如果传递NULL,表示不关心子进程的退出状态信息
否则,操作系统会根据该参数,将子进程的退出信息反馈给子进程
status不能简单的当做整型来看待,可以当做位图来看待,其格式如下图:
解析:
若是正常退出的status:在其低16位的高8位中存储子进程的返回值
若是异常退出:status低16位中的低8位的最高位存储 core dump标志,该位若程序退出时,会保存程序的运行信息,剩下的低7位中保存异常退出的信号值
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sys/wait.h>
int main()
{
pid_t pid = fork();
if(pid == -1)
{
perror("fork");
exit(1);
}
else if(pid == 0)
{
//child
sleep(20);
exit(10);
}
else
{
int st;
int ret = wait(&st);
if(ret > 0 && (st & 0x7f) == 0)
{
//正常退出
printf("child exit code: %d\n", (st >> 8) & 0xff);
}
else if(ret > 0)
{
//异常退出
printf("sig code : %d\n", st & 0x7f);
}
}
return 0;
}
测试结果:
[adam_xi@localhost test]$ ./test #等20秒后退出
child exit code: 10
[adam_xi@localhost test]$ ./test #在其他终端kill掉当前进程
sig code : 9
【注意】
1、wait调用次数必须与子进程个数一致:若wait()调用次数较子进程个数少,导致子进程称为僵尸进程;若wait()调用次数较子进程个数多,会导致函数调用出错
2、若有多个子进程,任一个子进程结束都会触发wait()的返回
3、waitpid()中,若当前为非阻塞等待,若指定的pid仍未结束,waitpid()函数会直接返回,导致子进程可能为僵尸进程,所以往往需要循环等待来避免僵尸进程的产生,这种方式成为轮询
进程替换
原理
用fork()创建出来的子进程执行的是和父进程相同的程序(但是有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数族中的函数后,该进程的用户看空间代码和数据完全被新程序替换,从新程序的启动位置开始执行。需注意,调用exec函数并不是创建新进程,所以调用exec前后该进程的id并未改变
替换函数
exec函数族中共有六种函数,如下列述(前五种是库函数,最后一种是系统调用接口)
#include <unistd.h>`
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ...,char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *file, char *const argv[]); //系统调用接口
对函数的理解
l -> list:表示参数采用列表形式,即全部陈列式平铺在参数列表中,最后以NULL结尾
v -> vector:表示采用数组。使用字符串指针数组来保存参数,数组最后一位元素必须为NULL
p -> path:若带p表示会自动搜索环境变量PATH。去path所指定的路径下查找程序
e -> environ:表示需要自己维护环境变量
参数名 | 参数格式 | 是否带路径 | 是否使用当前环境变量 |
---|---|---|---|
execl | 列表 | 不是 | 是 |
execlp | 列表 | 是 | 是 |
execle | 列表 | 不是 | 不是,需要自己维护环境变量 |
execv | 列表 | 不是 | 是 |
execvp | 列表 | 是 | 是 |
execve | 列表 | 不是 | 不是,需要自己维护环境变量 |
举例如下:
#include <unistd.h>
int main()
{
char *const argv[] = {"ps", "-ef", NULL};
char *const envp[] = {"PATH=/bin:/usr/bin", "TERM=console", NULL};
execl("/bin/ps", "ps", "-ef", NULL);
// 带p的,可以使用环境变量PATH,无需写全路径
execlp("ps", "ps", "-ef", NULL);
// 带e的,需要自己组装环境变量
execle("ps", "ps", "-ef", NULL, envp);
execv("/bin/ps", argv);
// 带p的,可以使用环境变量PATH,无需写全路径
execvp("ps", argv);
// 带e的,需要自己组装环境变量
execve("/bin/ps", argv, envp);
return 0;
}
【注意】
1、进程替换不会新建一个进程,也不会销毁一个进程
2、进程替换会替换一个进程的数据段和代码段等,原有的堆栈中的内容全都舍弃,根据新的代码的执行过程,重新构建堆和栈中的内容
3、函数中的参数列表平铺式的、用数组保存参数传入的、自己维护环境变量在一个数组中的情况下,都需要在最后一项以NULL结尾