我们通过fork
函数创建多个子进程,并通过exec
函数族在子进程中进行其他的工作,但是为了避免僵尸进程,我们要对子进程进行回收。常用的回收方式是wait
或者waitpid
进行阻塞回收,因为如果非阻塞回收很难把握时机,而阻塞回收将导致父进程无法进行其他的工作。通过子进程状态改变后会发送一个SIGCHLD
信号这一机制,我们可以在父进程中将这一信号进行捕获然后进行非阻塞的回收子进程并保证能够回收所有的,也不需要通过sleep
函数去强制保证异步。
通过捕获SIGCHLD
信号进行回收子进程最害怕的就是父进程还没有设置完捕获函数,子进程全部都死翘翘了,然后父进程就等不到SIGCHLD
信号,无法开始回收进程。为了避免这种情况,一般的解决方法是首先对子进程进行一个sleep
等待父进程设置捕获函数,我觉得这种做法十分低效,我想到的解决方式是在fork
函数前就对SIGCHLD
信号进行屏蔽,等父进程设置好捕获函数后再解除屏蔽,这样就不会错过SIGCHLD
信号啦。
另一方面因为未决信号集只是一个简单的位图,只能保存有该信号,不能保存该信号发送了多少次,因此我们每次回收进程都要把已经死亡的所有进程进行回收,因为有可能很多子进程一起死亡,这些信号一起发过来,我们不能一个信号只回收一个子进程。
代码如下:
Utils.h:封装了一些简单的操作,简化代码,实现放在文末
#ifndef LINUX_UTILS_H
#define LINUX_UTILS_H
#include <string>
#include <initializer_list>
#include <signal.h>
/*!
* 检查系统调用返回值
* @param x 返回值
* @param msg 错误提示语句
* @param y 错误状态,默认为-1
*/
bool check_error(int x, const std::string &msg = "error", int y = -1);
/*!
* 清零mask,并将il中的信号加入到mask中
* @param mask
* @param il
*/
void add2mask(sigset_t *mask, std::initializer_list<int> il);
/*!
* 将il中的信号从mask中删除
* @param mask
* @param il
*/
void del2mask(sigset_t *mask, std::initializer_list<int> il);
/*!
* 向阻塞信号集里面添加信号
* @param oldset
* @param il
*/
void add2procmask(std::initializer_list<int> il);
/*!
* 从阻塞信号集里面删除信号
* @param il
*/
void del2procmask(std::initializer_list<int> il);
#endif //LINUX_UTILS_H
创建子进程并回收:
int &wait_child_num() {
static int num = 0;
return num;
}
void wait_child(int signum) {
pid_t pid;
int wstatus;
while ((pid = waitpid(0, &wstatus, WNOHANG)) > 0) {
++wait_child_num();
if (WIFEXITED(wstatus)) {
cout << "process[" << pid << "] exited with " << WEXITSTATUS(wstatus) << endl;
} else {
cout << "process[" << pid << "] was terminated by signal " << WTERMSIG(wstatus) << endl;
}
}
}
int test_wait() {
int idx;
pid_t pid;
constexpr int N = 5;
/*!
* 在fork前应该将SIGALRM信号加入阻塞信号集,否则父进程还没有来得及设置信号捕捉函数回收子进程,他们全都死亡了,回收了个寂寞
*/
add2procmask({SIGCHLD});
for (idx = 0; idx < N; ++idx) {
pid = fork();
check_error(pid, "fork error");
if (pid == 0)
break;
}
if (idx == N) {
//父进程
//注册SIGALRM信号捕捉函数
struct sigaction act, oldact;
act.sa_flags = 0;
add2mask(&act.sa_mask, {SIGINT, SIGQUIT, SIGTSTP});
act.sa_handler = wait_child;
check_error(sigaction(SIGCHLD, &act, &oldact), "sigaction error");
//解除对SIGALRM的屏蔽
del2procmask({SIGCHLD});
cout << "begin to wait for children" << endl;
while (wait_child_num() < N);
check_error(sigaction(SIGCHLD, &oldact, nullptr), "sigaction error");
} else {
my_sleep(idx, 0);
}
}
其中mysleep
函数是我自己实现的sleep
函数,如果有兴趣可以看我的另一篇博客:Linux信号实现精确到微秒的sleep函数:通过sigsuspend函数解决时序竞态问题
通过wait_child_num
返回一个局部静态变量num
引用获取回收了的子进程的个数,虽然在捕获函数中使用静态变量将导致捕获函数不再是一个可重入函数,但是因为在我的代码中只有捕获函数会对num
进行写操作,因此不会发生全局变量异步IO,而且在捕获信号期间会对SIGCHLD
信号屏蔽(通过设置sigaction
结构体的sa_flags
为0),也不用担心会发生重入。
之所以将其变成一个局部静态变量而不是直接使用一个静态变量是 Effective C++ 条款18:让接口容易被正确使用的建议,尽可能使用局部静态变量,因为这样一方面可以避免名字污染,另一方面可以避免初始化次序问题,当在多个文件中的时候确保使用到该变量时能够被初始化。
通过测试和查阅APUE,我发现子进程的阻塞信号集和父进程是一致的,但是未决信号集子进程会清零。
Utils.cpp:工具函数的实现,非常简单
#include "utils.h"
using std::string;
bool check_error(int x, const string &msg, int y) {
if (x == y) {
perror(msg.c_str());
exit(1);
}
return true;
}
void add2mask(sigset_t *mask, std::initializer_list<int> il) {
check_error(sigemptyset(mask), "sigemptyset error");
for (auto signum : il) {
check_error(sigaddset(mask, signum), "sigaddset error");
}
}
void del2mask(sigset_t *mask, std::initializer_list<int> il) {
for (auto signum : il) {
check_error(sigdelset(mask, signum), "sigdelset error");
}
}
void add2procmask(std::initializer_list<int> il) {
sigset_t mask;
add2mask(&mask, il);
check_error(sigprocmask(SIG_BLOCK, &mask, nullptr), "sigprocmask error");
}
void del2procmask(std::initializer_list<int> il) {
sigset_t mask;
add2mask(&mask, il);
check_error(sigprocmask(SIG_UNBLOCK, &mask, nullptr), "sigprocmask error");
}