#ifndef _ASM_GENERIC_ERRNO_BASE_H
#define _ASM_GENERIC_ERRNO_BASE_H
#define EPERM 1 /* Operation not permitted */
#define ENOENT 2 /* No such file or directory */
#define ESRCH 3 /* No such process */
#define EINTR 4 /* Interrupted system call */
#define EIO 5 /* I/O error */
#define ENXIO 6 /* No such device or address */
#define E2BIG 7 /* Argument list too long */
#define ENOEXEC 8 /* Exec format error */
#define EBADF 9 /* Bad file number */
#define ECHILD 10 /* No child processes */
#define EAGAIN 11 /* Try again */
#define ENOMEM 12 /* Out of memory */
#define EACCES 13 /* Permission denied */
#define EFAULT 14 /* Bad address */
#define ENOTBLK 15 /* Block device required */
#define EBUSY 16 /* Device or resource busy */
#define EEXIST 17 /* File exists */
#define EXDEV 18 /* Cross-device link */
#define ENODEV 19 /* No such device */
#define ENOTDIR 20 /* Not a directory */
#define EISDIR 21 /* Is a directory */
#define EINVAL 22 /* Invalid argument */
#define ENFILE 23 /* File table overflow */
#define EMFILE 24 /* Too many open files */
#define ENOTTY 25 /* Not a typewriter */
#define ETXTBSY 26 /* Text file busy */
#define EFBIG 27 /* File too large */
#define ENOSPC 28 /* No space left on device */
#define ESPIPE 29 /* Illegal seek */
#define EROFS 30 /* Read-only file system */
#define EMLINK 31 /* Too many links */
#define EPIPE 32 /* Broken pipe */
#define EDOM 33 /* Math argument out of domain of func */
#define ERANGE 34 /* Math result not representable */
#endif
假如accept返回EMFILE该如何应对?这意味着本进程打开的文件描述符已经打到上限,无法为新连接创建socket文件描述符。但是,既然没有sockt文件描述符来表示这个连接,我们无法close它。程序会继续运行,回到再次调用的epoll_wait。这个时候epoll_wait会立刻返回,因为有新连接还等待处理,listenning fd 还是可读的(POLLIN事件)。这样程序会陷入busy loop状态,CPU占有率接近100%,会影响本系统的其他服务,也会影响同一机器上的其他服务。
如何处理那?
1、调高进程的文件描述符数目。治标不治本,因为只要有足够多的客户端,就一定能把一个服务进程的文件描述符用户
2、死等。鸵鸟算法(传说中鸵鸟看到危险就把头埋在地底下。当你对某一件事情没有一个很好的解决方法时,那就忽略它,就像鸵鸟面对危险时会把它深埋在沙砾中,装作看不到。这样的算法称为“鸵鸟算法“。鸵鸟算法,是平衡性能和复杂性而选择的一种方法。)
3、退出程序。似乎小题大做,为这种暂时的错误而中断现有的服务似乎不值得
4、关闭监听listenning fd。那么什么时候重新打开那
5、改用edge trigger。如果漏掉了一次accept(2),程序再也不会收到连接
6、准备一个空闲的文件描述符。如遇到这种情况,先关闭这个空闲的文件,获得了一个文件描述符的名额;再accept拿到新socket连接的描述符;随后立刻关闭close它,这样就优雅的断开了客户端连接;最后重新打开一个空闲的文件,把“坑”占住,已被再次出现这种情况时使用。
7、file descriptor是hard limit,我们可以自己设一个稍微第一点的soft limit,如果超过soft limit 就主动关闭新连接,这样就避免触及“file descriptor耗尽”这种边界条件。比方说当前进程的max file descriptor是1024,那么我们可以在连接数打到1000的时候进入“拒绝新连接”的状态
第2、5种做法会导致客户端认为连接已经建立,但是无法获取服务,因为服务端程序没有拿到连接的文件描述符
代码形式如下:
int idleFd_=::open("/dev/null", O_RDONLY | O_CLOEXEC);
int connfd = acceptSocket_.accept();
if (connfd >= 0)
{
.............................
}
else
{
if (errno == EMFILE)
{
::close(idleFd_);
idleFd_ = ::accept(acceptSocket_.fd,NULL,NULL)
:close(idleFd_);
idleFd_ = ::open("/dev/null", O_RDONLY | O_CLOEXEC);
}
}