Linux epoll机制

最新推荐文章于 2024-05-06 22:56:29 发布

weixin_34380948

最新推荐文章于 2024-05-06 22:56:29 发布

阅读量43

点赞数

文章标签： epoll

原文链接：http://www.cnblogs.com/henryliublog/p/9645562.html

版权

epoll_create、epoll_ctl、epoll_wait、close

在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，linux/posix_types.h头文件有这样的声明：
#define__FD_SETSIZE 1024
表示select最多同时监听1024个fd，当然，可以通过修改头文件再重编译内核来扩大这个数目，但这似乎并不治本

epoll的接口非常简单，一共就三个函数： 1.创建epoll句柄 int epfd = epoll_create(intsize);

创建一个epoll的句柄，size用来告诉内核这个监听的数目一共有多大。这个参数不同于select()中的第一个参数，给出最大监听的fd+1的值。需要注意的是，当创建好epoll句柄后，它就是会占用一个fd值，在linux下如果查看/proc/进程id/fd/，是能够看到这个fd的，所以在使用完epoll后，必须调用close()关闭，否则可能导致fd被耗尽。 函数声明：int epoll_create(int size) 该函数生成一个epoll专用的文件描述符。它其实是在内核申请一空间，用来存放你想关注的socket fd上是否发生以及发生了什么事件。size就是你在这个epoll fd上能关注的最大socket fd数。随你定好了。只要你有空间。可参见上面与select之不同 2.将被监听的描述符添加到epoll句柄或从epool句柄中删除或者对监听事件进行修改。

函数声明：int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event) 该函数用于控制某个epoll文件描述符上的事件，可以注册事件，修改事件，删除事件。参数： epfd：由 epoll_create 生成的epoll专用的文件描述符； op：要进行的操作例如注册事件，可能的取值EPOLL_CTL_ADD 注册、EPOLL_CTL_MOD 修改、EPOLL_CTL_DEL 删除
fd：关联的文件描述符； event：指向epoll_event的指针；如果调用成功返回0,不成功返回-1

int epoll_ctl(int epfd, intop, int fd, struct epoll_event*event);

epoll的事件注册函数，它不同与select()是在监听事件时告诉内核要监听什么类型的事件，而是在这里先注册要监听的事件类型。

第一个参数是epoll_create()的返回值，

第二个参数表示动作，用三个宏来表示： EPOLL_CTL_ADD：注册新的fd到epfd中； EPOLL_CTL_MOD：修改已经注册的fd的监听事件； EPOLL_CTL_DEL：从epfd中删除一个fd；第三个参数是需要监听的fd，

第四个参数是告诉内核需要监听什么事件，structepoll_event结构如下：

typedef union epoll_data {

　　void *ptr;

　　int fd;

　　__uint32_t u32;

　　__uint64_t u64;

} epoll_data_t;

struct epoll_event {

　　__uint32_t events; /* Epoll events */

　　epoll_data_t data; /* User data variable */

};

events可以是以下几个宏的集合：
         EPOLLIN：            触发该事件，表示对应的文件描述符上有可读数据。(包括对端SOCKET正常关闭)；
         EPOLLOUT：         触发该事件，表示对应的文件描述符上可以写数据；
        EPOLLPRI：           表示对应的文件描述符有紧急的数据可读（这里应该表示有带外数据到来）；
        EPOLLERR：        表示对应的文件描述符发生错误；
         EPOLLHUP：        表示对应的文件描述符被挂断；
        EPOLLET：           将EPOLL设为边缘触发(Edge Triggered)模式，这是相对于水平触发(Level Triggered)来说的。
        EPOLLONESHOT：  只监听一次事件，当监听完这次事件之后，如果还需要继续监听这个socket的话，需要再次把这个socket加入到EPOLL队列里。

如：
struct epoll_event ev;
//设置与要处理的事件相关的文件描述符
ev.data.fd=listenfd;
//设置要处理的事件类型
ev.events=EPOLLIN|EPOLLET;
//注册epoll事件
epoll_ctl(epfd,EPOLL_CTL_ADD,listenfd,&ev);

3.等待事件触发，当超过timeout还没有事件触发时，就超时。

int epoll_wait(int epfd, struct epoll_event * events, intmaxevents, int timeout); 等待事件的产生，类似于select()调用。参数events用来从内核得到事件的集合，maxevents告之内核这个events有多大(数组成员的个数)，这个maxevents的值不能大于创建epoll_create()时的size，参数timeout是超时时间（毫秒，0会立即返回，-1将不确定，也有说法说是永久阻塞）。

该函数返回需要处理的事件数目，如返回0表示已超时。

返回的事件集合在events数组中，数组中实际存放的成员个数是函数的返回值。返回0表示已经超时

函数声明:int epoll_wait(int epfd,struct epoll_event * events,int maxevents,int timeout)
该函数用于轮询I/O事件的发生；
参数：
epfd:由epoll_create 生成的epoll专用的文件描述符；
epoll_event:用于回传代处理事件的数组；
maxevents:每次能处理的事件数；
timeout:等待I/O事件发生的超时值(单位我也不太清楚)；-1相当于阻塞，0相当于非阻塞。一般用-1即可
返回发生事件数。
epoll_wait运行的原理是
等侍注册在epfd上的socket fd的事件的发生，如果发生则将发生的sokct fd和事件类型放入到events数组中。
并且将注册在epfd上的socket fd的事件类型给清空，所以如果下一个循环你还要关注这个socket fd的话，则需要用epoll_ctl(epfd,EPOLL_CTL_MOD,listenfd,&ev)来重新设置socket fd的事件类型。这时不用EPOLL_CTL_ADD,因为socket fd并未清空，只是事件类型清空。这一步非常重要。

epoll_wait范围之后应该是一个循环，遍历所有的事件：

 
    nfds = epoll_wait(epfd,events,20,500);   
   
    { 
   
    for 
    (n=0;n<nfds;++n) 
   
    { 
   
    if 
    (events[n].data.fd==listener) 
   
    { 
   
    //如果是主socket的事件的话，则表示 
   
    //有新连接进入了，进行新连接的处理。 
   
    client=accept(listener,(structsockaddr*)&local,&addrlen); 
   
    if 
    (client<0) 
   
    { 
   
    perror 
    ( 
    "accept" 
    ); 
   
    continue 
    ; 
   
    } 
   
    setnonblocking(client); 
    //将新连接置于非阻塞模式 
   
    ev.events=EPOLLIN|EPOLLET; 
    //并且将新连接也加入EPOLL的监听队列。 
   
    //注意，这里的参数EPOLLIN|EPOLLET并没有设置对写socket的监听， 
   
    //如果有写操作的话，这个时候epoll是不会返回事件的，如果要对写操作 
   
    //也监听的话，应该是EPOLLIN|EPOLLOUT|EPOLLET 
   
    ev.data.fd=client; 
   
    if 
    (epoll_ctl(kdpfd,EPOLL_CTL_ADD,client,&ev)<0) 
   
    { 
   
    //设置好event之后，将这个新的event通过epoll_ctl加入到epoll的监听队列里面， 
   
    //这里用EPOLL_CTL_ADD来加一个新的epoll事件，通过EPOLL_CTL_DEL来减少一个 
   
    //epoll事件，通过EPOLL_CTL_MOD来改变一个事件的监听方式。 
   
    fprintf 
    (stderr,"epollsetinsertionerror:fd=%d0,client); 
   
    return 
    -1;d 
   
    } 
   
    } 
   
    elseif(event[n].events&EPOLLIN) 
   
    { 
   
    //如果是已经连接的用户，并且收到数据， 
   
    //那么进行读入 
   
    intsockfd_r; 
   
    if 
    ((sockfd_r=event[n].data.fd)<0) 
    continue 
    ; 
   
    read(sockfd_r,buffer,MAXSIZE); 
   
    //修改sockfd_r上要处理的事件为EPOLLOUT 
   
    ev.data.fd=sockfd_r; 
   
    ev.events=EPOLLOUT|EPOLLET; 
   
    epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd_r,&ev) 
   
    } 
   
    elseif(event[n].events&EPOLLOUT) 
   
    { 
   
    //如果有数据发送 
   
    intsockfd_w=events[n].data.fd; 
   
    write(sockfd_w,buffer, 
    sizeof 
    (buffer)); 
   
    //修改sockfd_w上要处理的事件为EPOLLIN 
   
    ev.data.fd=sockfd_w; 
   
    ev.events=EPOLLIN|EPOLLET; 
   
    epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd_w,&ev) 
   
    } 
   
    do_use_fd(events[n].data.fd); 
   
    } 
   
    }

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

从man手册中，得到ET和LT的具体描述如下
EPOLL事件有两种模型：
Edge Triggered(ET) //高速工作方式，错误率比较大，只支持no_block socket (非阻塞socket)
LevelTriggered(LT) //缺省工作方式，即默认的工作方式,支持blocksocket和no_blocksocket，错误率比较小。

假如有这样一个例子：(LT方式，即默认方式下，内核会继续通知，可以读数据，ET方式，内核不会再通知，可以读数据)
1.我们已经把一个用来从管道中读取数据的文件句柄(RFD)添加到epoll描述符
2. 这个时候从管道的另一端被写入了2KB的数据
3. 调用epoll_wait(2)，并且它会返回RFD，说明它已经准备好读取操作
4. 然后我们读取了1KB的数据
5. 调用epoll_wait(2)......

转载于:https://www.cnblogs.com/henryliublog/p/9645562.html

weixin_34380948

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Linux epoll机制

epoll_create、epoll_ctl、epoll_wait、close在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，...
复制链接

扫一扫