进程等待
一个进程在终止时会关闭所有的文件描述符,释放在用户空间分配出来的内存,但它的PCB还保留着,而且内核中还保存着一些信息,如果是正常终止,则保存着退出状态,如果是异常终止,则保存着导致该进程终止信号是哪个,。这个进程的父进程可以调用wait和waitpid获取这些信息,然后彻底清除这个进程。
一个进程的父进程是shell进程,当它终止时shell就会调用wait或者waitpid得到它的退出状态,然后清除这个进程。当一个进程正常或者异常终止的时候,内核就会向父进程发送SIGCHLD信号,对于这种信号,系统默认动作是忽略它。
【调用wait或者waitpid的进程会发生什么情况?】
(1)如果这个进程的所有子进程都还在运行,则这个进程就会阻塞。
(2)如果一个子进程已终止,正等待父进程获取其终止状态,则取得该子进程的终止状态后立即返回。
(3)如果这个进程它没有任何子进程,则立即出错返回。
头文件:
#include <sys/types.h>
#include <sys/wait.h>
1)pid_t wait(int *status);
返回值:成功返回被等待进程pid,失败返回-1
参数:输出型参数,获取进程退出状态,不关心则可以设置为NULL
如果进程由于接收到SIGCHLD而调用wait,则可期望wait会立即返回;但如果在任意时刻调用wait,则进程可能阻塞。
在一个子进程终止前, wait使其调用者堵塞,而waitpid有一个选项,可使调用者不堵塞。如果status不是空指针,则终止进程的终止状态就存放在它所指的单元内。如果不关心终止状态,则可将参数设置为空指针(waitpid同样适用)。
例:
运行结果:
2)pid_t waitpid(pid_t pid, int *status, int options);
返回值:
a、当正常返回的时候waitpid返回收集到的子进程的进程id
b、如果设置了选项WNOHANG,而调用中waipid发现没有已退出的子进程可收集,则返回0
c、如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在
d、当pid所指示的子进程不存在,或此进程存在,但不是调用进程的子进程,waitpid就会出错返回,这时errno被设置为ECHILD
参数:
a、pid(进程id)
pid=-1;等待任一个子进程,与wait等效。
pid >0;等待其进程ID与pid相等的子进程。
pid == 0;等待其组id等于进程组id的任一个子进程。
pid <-1;等待其组ID等于pid绝对值的任一个子进程。
b、status(int型)
status的高8位(WIFEXITED(status)) : 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
status的低8位 (WEXITSTATUS(status)) : 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)
例:
运行结果:
正常:
异常:exit(257);
3)检查wait和waitpid所返回的终止状态:
a、利用按位与,得到static的前8位和后8位
b、利用系统中的宏
WIFEXITED(status) : 若为正常终止子进程返回的状态,则为真。
WEXITSTATUS(status) : 若WIFEXITED非零,返回子进程退出码,提取进程退出返回值,如果子进程调exit(7),WEXITSTATUS(status就会返 回7。请注意,如果进程不是正常退出的,也就是说,WIFEXITED返回0,这个值就毫无意义。
说明:status 并不简简单单是一个整形变量,父进程和子进程之间所有的状态交互都要通过这个int来表示,所以这个int的若干bit位都是有特殊的含义的,那么这个“int”如何编码就比较重要了,和IP地址一样,它是比较紧凑的,或者说是比较拥挤的。
status指出了子进程是正常退出还是被非正常结束的(一个进程也可以被其他进程用信号结束),以及正常结束时的返回值,或被哪一个信号结束或进程的退出码是多少等信息,这些信息都被放在整数的不同二进制位中,所以用常规的方法读取会非常麻烦,所以开发者就设计了一套专门的宏(macro)来完成这项工作。
4)wait和waitpid的作用:
a、等待目的:子进程读取到子进程退出的一个状态信息
b、让系统释放掉子进程占有的僵尸状态的资源
c、运行时不保证父子进程谁先运行,可保证子进程先退出,等待使父子进程的退出同步起来(即退出产生一定的顺序)
5)waitpid提供了wait没有提供的功能:
a、waitpid可等待一个特定的进程
b、waitpid提供了一个wait的非阻塞版本
c、waitpid支持作业控制
程序替换
用fork创建子进程后执行的是和父进程相同的程序,子进程往往要调用一种exec函数来执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序进行替换,从新程序的启动例程开始执行,调用exec并不创建新的进程,所以调用exec前后该进程的id并未改变。
1)6种以exec开头的函数:
#incldue<unistd.h>
int execl(const char* path,const char* arg,....);
int execlp(const char* file,const char* arg,....);
int execle(const char* path,const char* arg,..., char* const emp[]);
int execv(const char* path,char* const argv[]);
int execp(const char* file,char* const argv[]);
int execve(const char* path,char* const argv[],char* const emp[]);
这些函数如果调用成功,则加载新的程序从启动代码开始执行,不再返回。如果调用出错则返回-1,所以exec函数只有出错的返回值而没有成功的返回值。
2)这些函数的规则:
不带字母p (表示path)的exec函数 第一个参数必须是程序的相对路径或绝对路径,例如"/bin/ls"或"./a.out",而不能 是"ls"或"a.out"。对于带字母p的函数: 如果参数中包含/,则将其视为路径名。 否则视为不带路径的程序名,在PATH环境变量的目录列表中搜索这个程序。
带有字母l( 表示list)的exec函数要求将新程序的每个命令行参数都当作一个参数传给它,命令行参数的个数是可变的,因此函数原型中有...,...中的最后一个可变参数应该是NULL, 起sentinel的作用。
带有字母v( 表示vector)的函数,则应该先构造一个指向各参数的指针数 组,然后将该数组的首地址当作参数传给它,数组中的最后一个指针也应该是NULL,就像main函数的argv参数或者环境变量表一样。
对于以e (表示environment)结尾的exec函数,可以把一份新的环境变量表传给它,其他exec函数仍使用当前的环境变量表执行新程序。
例:
运行结果: