序
僵死(zombie)进程简而言之就是:子进程退出时,父进程并未对其发出的SIGCHILD信号进行适当处理,导致子进程停留在僵死状态等待其父进程为其收尸,这个状态下的子进程就是僵死进程。
因为并发服务器常常fork很多子进程,子进程终结之后需要服务器进程去wait清理资源。对于某些进程,特别是服务器进程往往在请求到来时生成子进程处理请求。如果父进程不等待子进程结束,子进程将成为僵尸进程(zombie)从而占用系统资源。如果父进程等待子进程结束,将增加父进程的负担,影响服务器进程的并发性能。
查找所有的僵死进程
ps -A -o stat,ppid,pid,cmd | grep -e '^[Zz]'
处理僵死进程
最简单的方法忽略SIGCHLD信号让系统处理
在Linux下调用signal(SIGCHLD, SIG_IGN),可以简单地将 SIGCHLD信号的操作设为SIG_IGN忽略。 这样可以让内核把僵尸子进程转交给init进程去处理,省去了大量僵尸进程占用系统资源。(Linux Only)
父进程waitpid释放僵死进程
父进程在fork调用之前调用signal设置SIGCHLD信号处理函数。SIGCHLD处理函数如下:
void sig_chld(int signo)
{
pid_t pid;
int stat;
//Unix下如果一个信号在被阻塞期间产生一次或多次,那么该信号被解阻塞之后通常只递交一次,也就是说Unix信号默认是不排队的。
while ((pid=waitpid(-1, &stat, WNOHANG)) > 0)
{
pintf("child %d terminated\n", pid);
}
return;
}
通信注意事项
signal(SIGPIPE, SIG_IGN);
TCP是全双工的信道, 可以看作两条单工信道, TCP连接两端的两个端点各负责一条. 当对端调用close时, 虽然本意是关闭整个两条信道,
但本端只是收到FIN包. 按照TCP协议的语义, 表示对端只是关闭了其所负责的那一条单工信道, 仍然可以继续接收数据. 也就是说, 因为TCP协议的限制,
一个端点无法获知对端的socket是调用了close还是shutdown.
对一个已经收到FIN包的socket调用read方法,
如果接收缓冲已空, 则返回0, 这就是常说的表示连接关闭. 但第一次对其调用write方法时, 如果发送缓冲没问题, 会返回正确写入(发送).
但发送的报文会导致对端发送RST报文, 因为对端的socket已经调用了close, 完全关闭, 既不发送, 也不接收数据. 所以,
第二次调用write方法(假设在收到RST之后), 会生成SIGPIPE信号, 导致进程退出.
为了避免进程退出, 可以捕获SIGPIPE信号, 或者忽略它, 给它设置SIG_IGN信号处理函数:
signal(SIGPIPE, SIG_IGN);
这样, 第二次调用write方法时, 会返回-1, 同时errno置为SIGPIPE. 程序便能知道对端已经关闭.