进程创建
fork函数初始
fork函数从已存在的进程中创建一个进程。新进程为子进程,原来的进程为父进程。
#include<sys/types.h>
#include<unistd.h>
pid_t fork(void);
//子进程返回,父进程返回子进程的PID,如果出错,则为-1
进程调用fork函数,当控制转移到内核中的fork代码后,内核完成了以下工作:
1、分配新的内存块和内核数据结构
(task_struct等)
给子进程。
2、将父进程部分数据结构内容(mm_struct、页表等)
拷贝给子进程。
3、添加子进程到系统进程列表中。
4、fork返回,开始调度器调度。
fork变化
当一个进程调用fork之后,就有两个二进制代码相同的进程。因为子进程的数据结构部分是来自子进程,数据结构里面有相同的程序计数器,所以子进程就从fork函数之后开始运行,而不是重新运行代码。请看如下程序:
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main(){
printf("fork Before pid = %d\n",getpid());
pid_t id=fork();
if(id==-1){
printf("fork error!!!\n");
}
printf("fork after pid = %d ,fork return %d\n",getpid(),id);
return 0;
}
运行结果如下:
可以得出结论:
fork之前父进程独立执行,fork之后父子两个执行流分别运行。
但是fork之后,谁先运行由操作系统中的调度器决定。
fork函数返回值
子进程返回0
父进程返回子进程的PID
写时拷贝
通常,父子进程共享代码,父子进程在不写入数据时,对应的数据也是共享的,当任意一方试图写入时,便以写时拷贝的方式各自私有一份副本。
代码共享:
由于代码是不可修改的也就是只读的,操作系统本着节省的原则,如果各自私有一份就是浪费空间,所以代码是共享的。
数据各自私有一份:
因为进程具有独立性的,所以数据必须各自私有一份才能表现进程的独立。
写时拷贝:
由于数据是大量的,不是所有的数据都需要被修改,也不是所有的数据要被使用到,操作系统本着节省时间的原则,那么在fork之后数据不需要拷贝,当在用到的时候再拷贝,写时拷贝。
当修改数据之前,进程共享数据段,并把数据段的页表标记为只读,
当OS发现有任一进程要修改数据时,就会引起一个异常,操作系统立即处理这个异常然后发生写时拷贝,
将数据复制一份,这样父子进程就会有拥有独立的一份数据。
fork常规操作
1、一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如:父进程等待客户端请求,生成子进程来处理请求。
2、一个进程要执行一个不同的进程。例如子进程从fork返回后,调用exec函数。
fork调用失败的原因
1、系统中有太多的进程。
2、实际用户的进程数超过了限制。
进程退出
进程退出场景
1、代码运行完毕,结果正确。
2、代码运行完毕,结果不正确。
3、代码异常终止。
对应1、2点通过返回码来标识结果正确与否,对于第3点通过给出退出原因。
进程退出常见方式
正常终止(可以通过echo $?查看进程退出码):
1、从main函数中返回。
2、调用exit函数。
3、调用_exit系统函数。
异常退出):
ctrl+c:信号退出
_exit函数
#include<unistd.h>
void _exit(int status);
//参数:status定义了进程终止的状态,父进程通过wait来获取该值
//说明:虽然status是int,但是仅有低八位可以被父进程使用,所以_exit(-1)时,在终端执行$?发现返回值是255
exit函数
#include<unistd.h>
void exit(int status);
exit最后还是会调用_exit函数,但是在调用_exit函数时,还做了其他工作。
1、执行用户通过atexit或on_exit定义的清理函数。
2、关闭所有打开的函数,所有的数据均被写入。
3、调用_exit函数。
实例代码:
#include<stdio.h>
#include<unistd.h>
int main(){
printf("hello world");
sleep(2);
exit(0);
return 0;
}
运行结果:
[pengke@iZ8vber2m9d03iesgg0cjzZ Linux]$ ./exit
Hello World[pengke@iZ8vber2m9d03iesgg0cjzZ Linux]$
#include<stdio.h>
#include<unistd.h>
int main(){
printf("hello world");
sleep(2);
_exit(0);
return 0;
}
运行结果:
[pengke@iZ8vber2m9d03iesgg0cjzZ Linux]$ ./exit
[pengke@iZ8vber2m9d03iesgg0cjzZ Linux]$
return退出
return是终止函数,如果运行的函数从main函数中退出执行return n,那么就等同于执行exit(n),因为调用main的运行时函数会将main的返回值当做 exit的参数。如果是其他函数执行return n时,那么只能是退出函数的作用。一般main的return写成值为0,0在函数设计中,一般代表正确退出,如果是非0代表某种出错的含义。
进程等待
等待进程的必要性
1、子进程退出,如果父进程不管不顾,就可能造成“僵死进程”的问题,造成内存泄漏。
2、进程一旦变成僵尸状态,那就刀枪不入,kill -9也无能为力,因为谁也没有办法杀死一个已经死去的进程。
3、父进程派给子进程的任务完成得如何,
我们需要知道,如:子进程运行完成,结果对还是不对,或者是否正常退出。
4、父进程通过进程等待
的方式,回收子进程资源,获取子进程退出信息。
进程等待的方法
wait方法
#include<sys/types.h>
#include<sys/wait.h>
pid_t wait(int *status);
//返回值:成功:返回等待进程的PID,失败:返回 -1
//参数:输出型参数,获取进程退出状态,不关心则设置为NULL
waitpid方法
#include<sys/types.h>
#include<sys/wait.h>
pid_ t waitpid(pid_t pid, int *status, int options);
//返回值:
当正常返回的时候waitpid返回收集到的子进程的进程PID;
如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0;
如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在;
参数:
pid:
pid=-1,等待任一个子进程。与wait等效。
Pid>0.等待其进程ID与pid相等的子进程。
常用status参数:
WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看子进程是否出现异常退出)
WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看子进程的退出码、return的值)
常用options参数:
WNOHANG: 若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的ID。
1、如果子进程已经退出,调用wait/waitpid时,wait/waitpid会立即返回,并释放资源,获得子进程退出信息。
2、如果在任意时刻调用wait/waitpid,子进程存在并且正常运行时,则进程可能阻塞。
3、如果不存在子进程,那么立即返回 -1。
获取子进程status
1、wait和waitpid,都有一个status参数,该参数是一个输出型参数,操作系统会从进程的PCB中读取退出信息,保存到status指向的变量。
2、如果传递NULL,表示不关心子进程的退出状态信息。
3、否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。
4、status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16比特
位)
得到子进程的终止信号:status & 0x7F。
得到子进程的退出状态:(status>>8) & 0xFF。
先判断子进程是否收到终止信号,在判断退出码(返回值)。
实例代码:
#include<stdio.h>
#include<sys/types.h>
#include<sys/wait.h>
#include<unistd.h>
#include<stdlib.h>
int main(){
pid_t id=fork();
if(id==0){
int count=0;
while(count<5){
printf("child [%d] is running!!!\n",getpid());
sleep(2);
count++;
}
exit(5);
}else if(id>0){
int status;
int cid=waitpid(id,&status,0);
if(cid>0){
if(!(status & 0x7F)){
printf("child exit code : %d",((status>>8)&0xFF));
}else{
printf("child exit error\n");
}
}
}else{
printf("fork error\n");
}
return 0;
}
进程的阻塞等待
#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/wait.h>
int main(){
pid_t id=fork();
if(id>0){
int status;
pid_t cid=waitpid(id,&status,0);
printf("this is test for wait!!!!\n");
if(cid==id&&WIFEXITED(status)){
printf("wait child success , child return code is : %d\n",WEXITSTATUS(status));
}else{
printf("wait child failed , return..\n");
}
}else if(id==0){
printf("child is running here, pid is: %d\n",getpid());
sleep(5);
exit(123);
}else{
printf("fork error!!!\n");
}
return 0;
}
运行结果:
进程的非阻塞等待
#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/wait.h>
int main(){
pid_t pid=fork();
if(pid==0){
int count=0;
while(count<8){
printf("child is running here!!!!\n");
sleep(1);
count++;
}
exit(123);
}else if(pid>0){
int status;
pid_t cid;
do{
cid=waitpid(pid,&status,WNOHANG);
if(cid==0){
printf("child is not quit,check later!!!\n");
sleep(1);
continue;
}
if(cid==pid){
if(WIFEXITED(status)){
printf("child exit code is : %d\n",WEXITSTATUS(status)) ;
}else{
printf("wait child failed!!\n");
}
break;
}
}while(1);
}else{
printf("fork error!!\n");
}
return 0;
}
运行结果:
进程程序替换
替换原理
用fork创建子进程后执行的是和父进程相同的程序,子进程往往要调用一种exec函数以执行另一个程序。当进程调用exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新进程的启动例程开始执行。调用exec函数并没有创建新进程,所以进程的pid不会改变。
替换函数
有六个函数以exec开头的函数,统称为exec函数:
#include<unistd.h>
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ...,char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
//对于const char *arg,...和char *const argv[] 相当于在控制台输出什么这里就填写什么
函数解释
1、这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回。
2、 如果调用出错返回-1。
3、exec函数在出错时才返回,成功不返回。
命名理解
l(list):表示参数采用列表
v(vector):参数采用数组
p(path):用p自动搜索环境变量PATH
e(env):表示自己维护变量
参数名 | 参数格式 | 是否带路径 | 是否使用当前环境变量 |
---|---|---|---|
execl | 列表 | 不是 | 是 |
execlp | 列表 | 是 | 是 |
execle | 列表 | 不是 | 不是,需自己组装环境变量 |
execv | 数组 | 不是 | 是 |
execvp | 数组 | 是 | 是 |
execve | 数组 | 不是 | 不是,需自己组装环境变量 |
exec调用举例如下:
#include<stdio.h>
int main()
{
char *const argv[] = {"ps", "-aux", NULL};
char *const envp[] = {"PATH=/bin:/usr/bin", "TERM=console", NULL};
execl("/usr/bin/ps", "ps", "-aux", NULL);
// 带p的,可以使用环境变量PATH,无需写全路径
execlp("ps", "ps", "-aux", NULL);
// 带e的,需要自己组装环境变量
execle("ps", "ps", "-aux", NULL, envp);
execv("/usr/bin/ps", argv);
// 带p的,可以使用环境变量PATH,无需写全路径
execvp("ps", argv);
// 带e的,需要自己组装环境变量
execve("/usr/bin/ps", argv, envp);
exit(0);
}