epoll
epoll概念
\qquad
epoll
没有描述符的限制,epoll
使用一个文件描述符管理多个描述符,将用户关系的文件描述符的事件存放到内核的一个事件表中,这样在用户空间和内核空间之间的数据拷贝只需一次。
epoll接口
int epoll_create(int size);
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout)
epoll_create()
\qquad
该函数的作用是创建一个epoll
句柄,size
用来告诉内核要监听的数目,这个参数不同于select()
中的第一个参数是最大监听的fd+1
。需要注意的是,当创建好epoll
句柄后,它就会占用一个fd
值,所以在使用完epoll
后,必须调用close()
关闭,否则可能导致fd
被耗尽。
epoll_ctl()
\qquad
该函数是epoll
事件注册函数,它不同于select()
在监听事件时告诉内核要监听什么类型的事件,而是先注册要监听的事件类型:
第一个参数是epoll_create()
的返回值。第二个参数是动作,用三个宏来表示:
① EPOLL_CTL_ADD,注册新的fd
到epfd
② EPOLL_CTL_MOD,修改已经注册的fd
的监听事件
③ EPOLL_CTL_DEL,从epfd
中删除一个fd
第三个参数是需要监听的fd
。
第四个参数是告诉内核需要监听什么事,struct epoll_event
的结构如下:
struct epoll_struct {
__uint32_t events;
epoll_data_t data;
};
event
可以是以下几个宏的集合:
① EPOLLIN,表示对应的文件描述符可以读(包括对端socket
正常关闭)。
② EPOLLOUT,表示对应的文件描述符可以写。
③ EPOLLPRI,表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来)。
④ EPOLLERR,表示对应的文件描述符发生错误。
⑤ EPOLLHUP,表示对应的文件描述符被挂断。
⑥ EPOLLET,将EPOLL设为边缘触发,这是相对于水平触发来说的。
⑦ EPOLLONESHOT,只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里。
epoll_wait()
\qquad
第三个函数等待事件的产生,类似于select()
调用。参数events
用来从内核得到事件的集合,maxevents
告诉内核这个event
有多大,且maxevents
的值不能大于epoll_create()
时的size
,参数timeout
是超时时间。该函数返回需要处理的时间数目,如返回0表示已经超时。
epoll优点
\qquad
select()所能打开的fd
是有一定限制的,由FD_SETSIZE
的默认值是1024/2048,对于那些需要上万连接的即使通信服务器来说显然太少了。epoll
没有这个限制,它所支持的fd
上限是最大可以打开的文件数目,1GB内存的空间中大概可以打开十万个,和系统内存关系很大。
\qquad
传统的select/poll
的另一个缺点是当你拥有一个很大的socket
集合,不过由于网络延迟,任一时间只有部分的socket
是"活跃"的,但是select/poll
每次调用都会线性扫描全部的集合,导致效率呈线性下降。但是epoll
不存在这个问题,他只会对"活跃"的socket
进行操作,这是因为在内核中实现epoll
是根据每个fd
上面的callback
函数实现的。那么,只有"活跃"的socket
才会主动去调用callback
函数,其他idle
状态的socket
则不会。