I/O复用----epoll

一、内核事件表

    epoll是linux特有的I/0复用函数,它在实现和使用上与select、poll有很大差异。

    首先,epoll使用一组函数来完成任务,而不是单个函数;

    其次,epoll吧用户关心的文件描述符上的事件放在内核里的一个事件表中,从而无须像select和poll那样每次调用都要重复传入文件描述符集或事件集。但epoll需要一个额外的文件描述符,来唯一标示内核中的这个事件表。这个文件描述符使用epoll_create函数来创建:

#include <sys/epoll.h>
int epoll_create(int size);

    size参数现在并不起作用,只是给内核一个提示,告诉它事件表需要多大。

    该函数返回的文件描述符将用作其他所有epoll系统调用的第一个参数,以指定要访问的内核事件表。

    下面函数来操作内核事件表:

#include <sys/epoll.h>

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)

    fd参数是要操作的文件描述符,op参数则指定操作类型。操作类型有如下3种:

        EPOLL_CTL_ADD,往事件表中注册fd上的事件。

        EPOLL_CTL_MOD,修改fd上的注册事件。

        EPOLL_CTL_DEL,删除fd上的注册事件。

    event参数指定事件,它是epoll_event结构指针类型。定义如下:

struct epoll_event
{
    _uint32_t events;    //epoll事件
    epoll_data_t data;    //用户数据
}

    其中events成员描述事件类型。epoll支持的事件类型和poll基本相同。标示epoll事件类型的宏是在poll对应的宏前加上“E”,比如epoll的数据可读事件是EPOLLIN。但epoll有两个额外的事件类型---EPOLLET和EPOLLONESHOT。data成员用于储存用户数据,定义如下:

typedef union epoll_data
{
    void *ptr;
    int fd;
    uint32_t u32;
    uint64_t u64;
}epoll_data_t;

    epoll_data_t是一个联合体,其4个成员中使用最多的是fd,它指定事件所从属的目标文件描述符。ptr成员可用来指定与fd相关的用户数据。但由于epoll_data_t是一个联合体,不能同时使用其ptr和fd。

    返回值:

    成功返回0,失败返回-1并设置error。


二、epoll_wait函数

    epoll系列系统调用的主要接口是epoll_wait函数。它在一段时间内等待一组文件描述符上的事件,原型如下:

#include <sys/epoll.h>

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);

    返回值:

    成功时返回就绪的文件描述符的个数,失败时返回-1并设置error。

    epfd标示内核事件表,maxevents参数指定最多监听多少个事件,它必须大于0。

    epoll_wait函数如果检测到事件,就将所有就绪的事件从内核事件表(由epfd参数指定)中复制到它的第二个参数events指向的数组中。这个数组只用于输出epoll_wait检测到的就绪事件,而不像select和poll的数组参数那样既用于传入用户注册的事件,又用于输出内核检测到的就绪事件。这就极大提高了应用程序索引就绪文件描述符的效率。


三、LT 和 ET模式

    epoll对文件描述符的操作有两种模式:LT(Level Trigger,电平触发)模式和ET(Edge Trigger,边沿触发)模式。LT是默认的工作模式,在此模式下epoll相当于一个效率较高的poll。当往epoll内核事件表种注册一个文件描述符上的EPOLLET事件时,epoll将以ET模式来操作该文件描述符。ET是epoll的高效的工作模式。

    1),LT工作模式的文件描述符

    当epoll_wait检测到其上有事件发生并将此事件通知应用程序后,应用程序可以不立即处理该事件。这样,当应用程序下一次调用epoll_wait时,epoll_wait还会再次向应用程序通告此事件,直到该事件被处理

    2),ET工作模式的文件描述符

    当epoll_wait检测到其上有事件发生并将此事件通知应用程序后,应用程序必须立即处理该事件。因为后续的epoll_wait调用将不再向应用程序通知这一事件。

    可见,ET模式在很大程度上降低了同一个epoll事件被反复触发的次数,因此效率要比LT模式高。


四、EPOLLONESHOT事件

    即使我们使用ET模式,一个socket上的某个事件还是可能被触发多次。这在并发程序中就会引起一个问题。比如一个线程(或进程,下同)在读取完某个socket上的数据后开始处理这些数据,而在数据的处理过程中该socket上又有新数据可读(EPOLLIN再次被触发),此时另外一个线程被唤醒来读取这些新的数据。于是就出现了两个线程同时操作一个socket的局面。这当然不是我们期望的。我们期望的是一个socket连接在任一时刻只被一个线程处理。这一点可以使用EPOLLONESHOT事件来实现。

    对于注册了EPOLLONESHOT事件的文件描述符,操作系统最多触发其上注册的一个可读、可写或异常事件,且只触发一次,除非我们使用epoll_ctl函数重置该文件描述符上注册的EPOLLONESHOT事件。这样,当一个线程在处理某个socket时,其他线程不可能有机会操作该socket的。但反过来思考,注册了EPOLLONESHOT事件的socket一旦被某个线程处理完毕,该线程就应该立即重置这个socket上的EPOLLONESHOT事件,以确保这个socket下一次可读时,其EPOLLIN事件能被触发,进而让其他工作线程有机会继续处理这个socket。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值