select、poll和epoll这三组I/O复用系统调用都能同时监听多个文件描述符。它们将等待由timeout参数指定的超时时间,直到一个或者多个文件描述符上有事件发生时返回,返回值是就绪的文件描述符的数量。返回0表示没有事件发生。现在我们从事件集、最大支持文件描述符、工作模式和具体实现等四个方面进一步比较他们的异同,以明确在实际应用中应该选择使用那个。
这三组函数都能通过某种结构体变量来告诉内核监听哪些文件描述符上的哪些事件,并使用该结构体类型的参数来获取内核处理的结果。
select
select的参数类型fs_set没有将文件描述符和事件绑定,它仅仅是一个文件描述符集合,因此select需要提供3个这种类型的参数来分别传入和输出可读、可写及异常等事件。这一方面使得select不能处理更多类型的事件,另一方面由于内核对fd_set集合的在线修改,应用程序下次调用select前不得不重置这三个fd_set。
poll
poll的参数类型pollfd则聪明一些。它把文件描述符和事件都定义在其中,任何事件都被统一处理,从而使得编程接口简洁得多。并且内核每次修改的是pollfd结构体的revents成员,而events成员保持不变,因此下次调用poll时应用程序无须重置pollfd类型的事件集合参数。由于每次select和poll调用都返回整个用户注册的事件集合(其中包括就绪的和未就绪的),所以应用程序索引就绪文件描述符的事件复杂度为O(n)。
epoll
epoll采用与select和poll完全不同的方式来管理用户注册的事件。它在内核中维护一个事件表并提供了一个独立的系统调用epoll_ctl来控制往其中添加、删除、修改事件。这样,每次epoll_wait调用都直接从该内核事件表中取得用户注册的事件,而无须反复从用户空间读入这些事件。epoll_wait系统调用的events参数仅用来返回就绪的事件,这使得应用程序索引就绪文件描述符的事件复杂度为O(1)。
最大支持文件描述符
poll和epoll_wait分别用ndfs和maxevents参数指定最多监听多少个文件描述符和事件。这两个数值都能达到系统允许打开的最大文件描述符数目,即65535。而select允许监听的最大文件描述符通常有限制,虽然用户可以修改这个限制,但是该值增大后,每次遍历系统开销的成本较大。
select和poll都只能工作在相对低效的LT模式,而epoll则可以工作在ET高效模式,并且epoll还支持EPOLLONESHOT事件。该事件能进一步减少可读、可写和异常等事件被触发的次数。
具体实现
从实现原理上来说,select和poll采用的都是轮训的方式,即每次调用都要扫描整个注册文件描述符集合,并将其中就绪的文件描述符返回给用户程序,因此他们检测就绪事件的算法事件复杂度是O(n)。epoll_wait则不同,它采用的回调的方式。内核检测到就绪的文件描述符时,将触发回调函数,回调函数就将该文件描述符上对应的事件插入内核就绪队列中。内核最后在适当的实际将就绪事件队列中的内容拷贝到用户空间。因此epoll_wait无须轮训整个文件描述符集合来检测哪些事件已经就绪,其算法事件复杂度是O(1),但是当活动连接比较多的时候,epoll_wait的效率未必比select和poll高,因为次回调函数被触发的过于频繁。所以epoll_wait适用于连接数量多,但活动连接较少的情况。