fork函数、进程退出、进程等待、status介绍
进程控制详解
进程创建
fork函数初识
在linux中fork函数时非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。
#include <unistd.h>
pid_t fork(void);
返回值:自进程中返回0,父进程返回子进程id,出错返回-1
进程调用fork,当控制转移到内核中的fork代码后,内核做:
- 分配新的内存块和内核数据结构给子进程
- 将父进程部分数据结构内容拷贝至子进程
- 添加子进程到系统进程列表当中
- fork返回,开始调度器调度
当一个进程调用fork之后,就有两个二进制代码相同的进程。而且它们都运行到相同的地方。但每个进程都将可以开始它们自己的旅程,看如下程序。
int main( void )
{
pid_t pid;
printf("Before: pid is %d\n", getpid());
if ( (pid=fork()) == -1 ) perror("fork()"),exit(1);
printf("After :pid is %d, fork return %d\n", getpid(), pid);
sleep(1);
return 0;
}
运行结果:
[root@localhost linux]# ./a.out
Before: pid is 43676
After:pid is 43676, fork return 43677
After:pid is 43677, fork return 0
这里看到了三行输出,一行before,两行after。进程43676先打印before消息,然后它有打印after。另一个after消息有43677打印的。注意到进程43677没有打印before,为什么呢?如下图所示:
所以,fork之前父进程独立执行,fork之后,父子两个执行流分别执行。注意,fork之后,谁先执行完全由调度器
决定。
fork函数返回值
- 子进程返回0,
- 父进程返回的是子进程的pid。
- 失败返回 -1
写时拷贝
通常,父子代码共享,父子再不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份副本。具体见下图:
注意:
在进程创建中就是:子进程复制了父进程中的大部分的信息,因此子进程有自己的变量,但是自己的变量经过页表映射后与父进程访问的是同一块物理内存, 当这块内存空间中的数据即将要修改(不管是子进程发生改变还是父进程发生改变,都会给子进程创建一块新的空间),则给子进程重新开辟内存空间,并拷贝数据过去写时拷贝技术:主要是提升子进程创建效率,避免不必要的内存消耗。(意思就是一开始父子进程访问同一块物理内存,没有给子进程创建独立的物理内存空间,当有一方发生改变之后,会给子进程创建独立的物理内存,这样就防止了子进程创建之后没有使用导致的资源浪费)
我们经常使用的malloc动态申请一块空间——其实只是先分配了 一个虚拟地址(物理内存并没有直接被开辟),当第一次要修改空间数据的时候才会被分配。
vfork函数 和 fork函数的简单区别
pid_ _t vfork(void)–创建一个子进程(在fork实现了写时拷贝技术之后,用的就很少了) ,创建一个子进程出来,父子进程共用同一个虚拟地址空间,“create a child process and block parent”——创建一个子进程并阻塞父进程,直到自己成exit退出,或程序替换之后,父进程再开始运行。
fork创建子进程之后,父子进程谁先运行不一定, 看系统调度但是vfork创建子进程,一定是子进程先运行, 只有子进程退出或者程序替换之后父进程才会继续运行。
父子进程共用同-一个虚拟地址空间,则意味着用的是同一个栈如果同时运行就会导致栈混乱,因此先阻塞父进程,直到子进程退出了(所有函数都出栈了)或者程序替换(意味着重新开辟了自己的地址空间,有了自己的栈),父进程才会运行
进程终止
进程退出场景
- 任务完美完成,正常退出
- 任务没有完成,正常退出
- 异常退出
进程常见退出方法
退出:(如何终止一个进程)
1 在main函数中return。 仅在main函数中使用是退出程序运行
return是终止一个函数,并返回- -个数据; main函数是程序的入口函数, 入口函数一旦退出,程序运行就会终止。
2.库函数: void exit(int retval) 在任意位置调用,都可以退出程序运行
系统调用接口是操作系统向.上层提供的用于访问内核的接口,功能相对都比较单一,大佬们针对典型场景。对系统调用接口进行封装,封装出了适用于典型场景库函数。
3.系统调用接口: void_ exit(int retval); 在任意位置调用,都可以退出程序运行
exit和_ exit的区别在于退出程序运行前,是否会将缓冲区中的数据进行刷新写入文件中。
退出程序有多种方式,在合适的场景选择合适的方式进行即可。
正常终止(可以通过 echo $? 查看进程退出码):
- 从main返回
- 调用exit
- _exit
异常退出:
-ctrl + c,信号终止
_exit函数
#include <unistd.h> void _exit(int status);
参数:status 定义了进程的终止状态,父进程通过wait来获取该值
说明:虽然status是int,但是仅有低8位可以被父进程所用。所以_exit(-1)时,在终端执行$?发现返回值 是255。
exit函数
#include <unistd.h>
void exit(int status);
exit最后也会调用_exit, 但在调用exit之前,还做了其他工作:
- 执行用户通过 atexit或on_exit定义的清理函数。
- 关闭所有打开的流,所有的缓存数据均被写入
- 调用_exit
如以下代码示范:
int main()
{
printf("hello");
exit(0);
}
运行结果:
[root@localhost linux]# ./a.out
hello[root@localhost linux]#
int main()
{
printf("hello");
_exit(0);
}
运行结果:
[root@localhost linux]# ./a.out
[root@localhost linux]#
这段代码就说明,使用exit函数会刷新缓冲区,而使用_exit的话就不会刷新缓冲区,
所以上述代码中_exit退出后不会进行打印。修改方法:在_exit的printf中加上“\n”即可。
return退出
return是一种更常见的退出进程方法。执行return n等同于执行exit(n),因为调用main的运行时函数会将main的返
回值当做 exit的参数。
进程退出返回值的意义:
return以及exit给与的数据其实就是进程的退出码
作用: 一个程序运行起来肯定是为了完成一个任务,但是这个任务完成的怎么样外界怎么知道呢?因此就必须有这个进程的退出码,来表示当前进程任务处理的结果。不管是return还是exit,都需要我们给出一个进程的返回值exit(0), return 0;给出的返回值,是进程的返回值因为一个进程就是为了调度运行一个程序, 完成一个任务的(但是任务完成有好有坏),就必须得有一种方式能够告诉我们这个任务完成的怎么样? (返回值的作用)
内存管理方式
分段式内存管理:将一个整体的地址空间划分为多个段(代码段,全局数据段,堆区,共享区,栈区,环境变量,运行参数…)
优势/作用:非更加利于编译器对于地址的管理。
重要的两个要素:段表,地址组成 虚拟地址组成:段号,段内的偏移量
段表:是一种数据结构,其中描述的信息,段号:物理内存的一个起始地址 映射:虚拟地址组成+段表
通过段号找到段表项,得到一块物理内存的起始地址
物理内存起始地址+偏移量就是实际数据存储在物理内存中的位置
分页式内存管理:将一个整体的地址空间划分 为大量的小的分页page (当前一般默认都是4096字节为一页)
作用:实现数据的离散存储,提高内存利用率
段页式内存管理:先将地址空间进行分段,然后在每个分段内使用分页进行管理(集合了分段式和分页式的优势) 映射:虚拟地址组成(页号+页内偏移)
页表(页号+物理块地址+访问权限+缺页中断…)
段页式:先对虚拟地址空间进行分段,在每个段内进行分页管理,集合分段与分页各自的优势进行内存管理
好处:
- .每个进程都有一个完整独立的虚拟地址空间,则地址可以随便使用,不用担心冲突(地址管理更加方便)
- 进过页表映射可以将数据存储在物理内存的任意位置,实现数据的离散式存储,提高内存利用率
- 在进行页表映射的之后可以进行访问权限的控制
进程等待
进程等待必要性
进程退出,父进程如果不管不顾,就可能造成‘僵尸进程’的问题,进而造成内存泄漏。另外,进程一旦变成僵尸状态,那就刀枪不入,“杀人不眨眼”的kill -9 也无能为力,因为谁也没有办法杀死一个已经死去的进程。最后,父进程派给子进程的任务完成的如何,我们需要知道,子进程运行完成,结果对还是不对,或者是否正常退出。父进程通过进程等待的方式,回收子进程资源,获取子进程退出信息。
进程等待的方法
wait方法
#include<sys/types.h>
#include<sys/wait.h>
pid_t wait(int*status);
返回值: 成功返回被等待进程pid,失败返回-1。
参数: 输出型参数,获取子进程退出状态,不关心则可以设置成为NULL
(子进程没有退出会一直等待,子进程退出会直接退出)
waitpid方法
pid_ t waitpid(pid_t pid, int status, int options);
返回值: 当正常返回的时候waitpid返回收集到的子进程的进程ID;如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0; 如果调用中出错,则返回*-1**,这时errno会被设置成相应的值以指示错误所在; 参数: pid:
Pid=-1,等待任一个子进程。与wait等效。
Pid>0.等待其进程ID与pid相等的子进程。
status:
WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)options:
WNOHANG: 若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的ID。0是默认阻塞
故:waipid(-1,&status,0)与wait等价,都是没获取到就堵塞,获取任意一个子进程的返回值
注意:
如果子进程已经退出,调用wait/waitpid时,wait/waitpid会立即返回,并且释放资源,获得子进程退出信息。
如果在任意时刻调用wait/waitpid,子进程存在且正常运行,则进程可能阻塞。
如果不存在该子进程,则立即出错返回。
获取子进程status
wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。如果传递NULL,表示不关心子进程的退出状态信息。否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16比特位,高16位暂时不关心):
低16位中的高8位保存进程退出码,之后有一个coredump标志位占据一个比特位,coredump文件很大,默认情况下是关闭的。
注意:通过wait获取的返回值,有多个信息,其中进程的退出码保存到高8位中,并且只用一个字节来保存,即(0~255),多了采取截断、
因此要获取一一个进程的退出码,首先得确定这个进程是否是正常退出的,如果是,才有意义。
代码中关心的问题:
如何判断进程是否是正常退出:取出status中的低7位; status & 0x7f(就是0111 1111)== 0正常退出,否则异常退出
如何从status中取出退出码:取出status中的低1 6位中的高8位 (status >> 8) & 0xff(1111 1111) 向右移动8位
问:exit()和status是怎么链接上的?
阻塞等待代码演示
int main()
{
pid_t pid;
pid = fork();
if(pid < 0){
printf("%s fork error\n",__FUNCTION__);
return 1;
} else if( pid == 0 ){ //child
printf("child is run, pid is : %d\n",getpid());
sleep(5);
exit(257);
} else{
int status = 0;
pid_t ret = waitpid(-1, &status, 0);//阻塞式等待,等待5S
printf("this is test for wait\n");
if( WIFEXITED(status) && ret == pid ){
printf("wait child 5s success, child return code is
:%d.\n",WEXITSTATUS(status));
}else{
printf("wait child failed, return.\n");
return 1;
}
}
return 0;
}
运行结果:
[root@localhost linux]# ./a.out
child is run, pid is : 45110
this is test for wait
wait child 5s success, child return code is :1.
进程的非阻塞等待方式:
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/wait.h>
int main()
{
pid_t pid;
pid = fork();
if(pid < 0){
printf("%s fork error\n",__FUNCTION__);
return 1;
}else if( pid == 0 ){ //child
printf("child is run, pid is : %d\n",getpid());
sleep(5);
exit(1);
} else{
int status = 0;
pid_t ret = 0;
do
{
ret = waitpid(-1, &status, WNOHANG);//非阻塞式等待
if( ret == 0 ){
printf("child is running\n");
}
sleep(1);
}while(ret == 0);
if( WIFEXITED(status) && ret == pid ){
printf("wait child 5s success, child return code is
:%d.\n",WEXITSTATUS(status));
}else{
printf("wait child failed, return.\n");
return 1;
}
}
return 0;
}