当一进程调用epoll_create方法时,Linux内核会创建一个eventpoll结构体,这个结构体中有两个成员与epoll的使用方式密切相关。eventpoll结构体如下所示:
struct eventpoll{
....
/*红黑树的根节点,这颗树中存储着所有添加到epoll中的需要监控的事件*/
struct rb_root rbr;
/*双链表中则存放着将要通过epoll_wait返回给用户的满足条件的事件*/
struct list_head rdlist;
....
};
struct rb_root rbr;//内核事件表(红黑树)
struct list_head rdlist;//就绪事件队列
每一个epoll对象都有一个独立的eventpoll结构体,用于存放通过epoll_ctl方法向epoll对象中添加进来的事件,每添加一个事件,会创建一个epitem结构体,这些事件都会挂载在红黑树中
struct epitem{
struct rb_node rbn;//红黑树节点
struct list_head rdllink;//双向链表节点
struct epoll_filefd ffd; //事件句柄信息
struct eventpoll *ep; //指向其所属的eventpoll对象
struct epoll_event event; //期待发生的事件类型
}
当调用epoll_wait检查是否有事件发生时,只需要检查eventpoll对象中的rdlist双链表中是否有epitem元素即可。如果rdlist不为空,则把发生的事件复制到用户态,同时将事件数量返回给用户。
内核就绪事件队列存放的都是就绪事件,所以只需要检查 struct list_head rdlist中是否有epitem元素即可。
以上可知,通过红黑树和双链表数据结构,并结合回调机制,造就了epoll的高效。
epoll用法:
1、epoll_create()系统调用。此调用返回一个句柄,之后所有的使用都依靠这个句柄来标识。
2、epoll_ctl()系统调用。通过此调用向epoll对象中添加、删除、修改感兴趣的事件,返回0标识成功,返回-1表示失败。
3、epoll_wait()系统调用。通过此调用收集收集在epoll监控中已经发生的事件。