epoll 实现机制
IO多路复用提出是为了解决网络通信中相当数量的客户端与一台服务器保持TCP连接的高并发场景的。在select/poll时代,服务器进程每次都把数以万计个连接告诉操作系统(从用户态复制句柄数据结构到内核态),让操作系统内核去查询这些套接字上是否有事件发生,轮询完后,再将句柄数据复制到用户态,让服务器应用程序轮询处理已发生的网络事件,这一过程资源消耗较大,因此,select/poll一般只能处理几千的并发连接。
epoll的设计和实现与select完全不同。epoll通过在Linux内核中申请一个简易的文件系统,把原先的select/poll调用分成了3个部分:
1.调用epoll_create()建立一个epoll对象。在调用这个函数时,Linux内核会创建一个eventpoll结构体,包括红黑树和双向链表数据结构。
2.调用epoll_ctl向epoll对象中添加需要连接的套接字。这个套接字就是需要监控的事件,而所有添加到epoll中的事件都会与设备驱动程序建立回调关系,一旦监控事件发生,即会调用内核中回调函数ep_poll_callback方法,它会将发生的事件添加到双向链表中。
3. 调用epoll_wait收集发生的事件的连接。调用该方法时,只需要检查eventpoll对象中的双向链表中是否有事件即可,如果双向链表不为空,则把发生事件复制到用户态,清空链表,同时将事件数量返回给用户。
这样在处理高并发网络连接请求时,只需要在进程启动时建立一个epoll对象,然后在需要的时候向这个epoll对象中添加或者删除连接。同时,epoll_wait的效率也非常高,因为调用epoll_wait时,并没有向操作系统复制数以万计个连接的句柄数据,只是将监控发生的事件复制到用户态,内核也不需要去遍历全部的连接,处理效率得到了提高。