对于reactor模式,listening socket是一种特殊的IO对象。当有新连接到来时,此socket变为可读,epoll_wait会返回这一事件,然后在事件处理器中调用accept获得新连接的socket,但是如果本机的file descriptor已经用尽,则accept会返回EMFILE,标志accept调用失败,新连接依旧在listen的连接池中没有取出来。既然没有socket文件描述符来表示这个连接,所以也不能close它。程序继续执行,调用epoll_wait。但是epoll_wait会立刻返回,因为前面的新连接还在连接池中等待处理,listening fd还是可读的,这样程序就陷入了busy loop中。CPU占用率会达到100%,影响了服务器的性能。
对策
- 调高进程的文件描述符数目(指标不治本)
- 死等(鸵鸟算法)
- 退出程序(小题大做)
- 关闭listening fd(但不能确定什么时候再打开)
- 改用edge trigger(如果漏掉一次accept,程序再也收不到新连接,导致客户端以为连接已经建立,但无法获得服务)
- 准备一个空闲的文件描述符,遇到这种情况,先关闭这个新的空闲文件,获得一个文件描述符的名额。再accept拿到新的socket连接描述符,随意立即close掉它;最后重新打开一个空闲文件,把坑占住,以备再次有这种情况发生。