IO多路转接 -- epoll

epoll

epoll 是Linux特有的I/O复用函数
它使用一组函数来实现对应任务.

1, epoll_create

使用 epoll_create 来创建一个 epoll 模型

int epoll_create(int size);

创建一个epoll的句柄,size用来告诉内核这个监听的数目一共有多大。
需要注意的是,当创建好epoll句柄后,它就是会占用一个fd值,在linux下如果查看/proc/进程id/fd/,是能够看到这个fd的,所以在使用完epoll后,必须调用close()关闭,否则可能导致fd被耗尽。
自从Linux 2.6.8开始,size参数被忽略,但是依然要大于0

创建一个epoll模型

  • 创建一棵红黑树 (节点: fd-event, fd:键值)
  • 创建一条就绪队列
  • 建立回调映射机制
  • 返回一个epoll句柄epfd, 来操纵模型
  • 用完之后, close()关闭
2, epoll_ctl
int epoll_ctl(int epfd, int op, int fd, 
              struct epoll_event *event);

epoll的事件注册函数,它不同与select()是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。
第一个参数是epoll_create()的返回值
第二个参数表示动作,用三个宏来表示:
EPOLL_CTL_ADD:注册新的fd到epfd中
EPOLL_CTL_MOD:修改已经注册的fd的监听事件
EPOLL_CTL_DEL:从epfd中删除一个fd
第三个参数是需要监听的fd
第四个参数是告诉内核需要监听什么事

struct epoll_event结构如下:

struct epoll_event {
    __uint32_t events; /* Epoll events */
    epoll_data_t data; /* User data variable */
};

events可以是以下几个宏的集合:

  • EPOLLIN: 表示对应的文件描述符可以读(包括对端SOCKET正常关闭)
  • EPOLLOUT:表示对应的文件描述符可以写
  • EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来)
  • EPOLLERR:表示对应的文件描述符发生错误
  • EPOLLHUP:表示对应的文件描述符被挂断
  • EPOLLET: 将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的
  • EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里
3, epoll_wait
int epoll_wait(int epfd, struct epoll_event * events, 
               int maxevents, int timeout)

等待事件的产生,类似于select()调用。
参数events用来从内核得到事件的集合
maxevents表示每次能处理的最大事件数,告之内核这个events有多大,这个maxevents的值不能大于创建epoll_create()时的size
参数timeout是超时时间(毫秒,0会立即返回,-1将不确定,也有说法说是永久阻塞)
该函数返回需要处理的事件数目,如返回0表示已超时

LT 模式 & ET 模式

LT模式是epoll默认的工作方式,相当于一个效率很高的poll模型
而ET是高效的工作方式

LT模式状态时,主线程正在epoll_wait等待事件时,请求到了,epoll_wait返回后没有去处理请求(recv),那么下次epoll_wait时此请求还是会返回
而ET模式状态下,这次没处理,下次epoll_wait时将不返回, 所以我们每次一定要全部处理完,由此很大程度降低了epoll_wait的触发次数
就是说, ET模式下, 必须一次把数据全部读完, 不然下次就读不到了.

epoll版本的tcp服务器
/*================================================================

# File Name: epoll_tcpServer.c
# Author: rjm
# mail: rjm96@foxmail.com
# Created Time: 2018年06月06日 星期三 15时01分14秒

================================================================*/


// epoll 的 LT 和 ET 模式

#include <stdio.h>
#include <stdlib.h>
#include <sys/epoll.h>
#include <fcntl.h>
#include <sys/socket.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <string.h>
#include <unistd.h>
#include <assert.h>
#include <errno.h>

#define MAX_EVENT_SIZE 1024
#define BUF_SIZE 10

// 将文件描述符设置为非阻塞的
void setnonblocking(int fd)
{
    int old_option = fcntl(fd, F_GETFL);
    int new_option = old_option | O_NONBLOCK;
    if(fcntl(fd, F_SETFL, new_option) == -1)
    {
        exit(-1);
        perror("fcntl");
    }
}

// 注册文件描述符和事件 
void _epoll_add(int epoll_fd, int fd, int mode_flag) // mode_flag 表示是否对 fd 启用 ET 模式
{
    struct epoll_event event;
    event.data.fd = fd;
    event.events = EPOLLIN;
    if(mode_flag == 1)
    {
        event.events |= EPOLLET;
    }
    setnonblocking(fd);
    epoll_ctl(epoll_fd, EPOLL_CTL_ADD, fd, &event);
}

// 获取监听套接字的接口
int _startUp(int port)
{
    if(port < 1024)
    {
        printf("Usage: ./server [port > 1024]\n");
        return 2;
    }
    struct sockaddr_in addr;
    bzero((void*)&addr, sizeof(addr));
    addr.sin_family = AF_INET;
    addr.sin_port = htons( port );
    addr.sin_addr.s_addr = INADDR_ANY;

    int listen_fd = socket(AF_INET, SOCK_STREAM, 0);
    if(listen_fd < 0)
    {
        perror("socket");
        return 3;
    }

    // 解决因为 timeout 引起的 bind 失败问题
    int opt = 1;
    setsockopt(listen_fd, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt));

    if(bind(listen_fd, (struct sockaddr*)&addr, sizeof(addr)) < 0)
    {
        perror("bind");
        return 4;
    }

    if(listen(listen_fd, 5) < 0)
    {
        perror("listen");
        return 5;
    }

    return listen_fd;
}

// LT 模式的工作流程
void lt(struct epoll_event* evs, int size, int epfd, int listen_fd)
{
    assert(evs != NULL);
    char buf[MAX_EVENT_SIZE];
    for(int i = 0; i < size; i++)
    {
        int sock_fd = evs[i].data.fd;
        if(sock_fd == listen_fd)
        {
            struct sockaddr_in client_addr;
            socklen_t client_addr_len = sizeof(client_addr);
            int connect_fd = accept(listen_fd, (struct sockaddr*)&client_addr, &client_addr_len);
            if(connect_fd < 0)
            {
                perror("accept");
                continue;
            }
            _epoll_add(epfd, connect_fd, 0); // 此时对 connect_fd 不使用 ET 模式
        }
        else if(evs[i].events & EPOLLIN)
        {
            printf("read event trigger ! \n");
            memset(buf, 0, BUF_SIZE);
            // int recv( _In_ SOCKET s, _Out_ char *buf, _In_ int len, _In_ int flags );
            int recv_ret = recv(sock_fd, buf, BUF_SIZE-1, 0);
            if(recv_ret <= 0)
            {
                close(sock_fd);
                continue;
            }
            printf("get %d bytes of content : %s\n", recv_ret, buf);
        }
        else
        {
            printf("other thing happend ... \n");
        }
    }
}

// ET 模式的工作流程
void et(struct epoll_event* evs, int size, int epfd, int listen_fd)
{
    assert(evs != NULL);
    char buf[MAX_EVENT_SIZE];
    for(int i = 0; i < size; i++)
    {
        int sock_fd = evs[i].data.fd;
        if(sock_fd == listen_fd)
        {
            struct sockaddr_in client_addr;
            socklen_t client_addr_len = sizeof(client_addr);
            int connect_fd = accept(listen_fd, (struct sockaddr*)&client_addr, &client_addr_len);
            if(connect_fd < 0)
            {
                perror("accept");
                continue;
            }
            _epoll_add(epfd, connect_fd, 1); // 此时对 connect_fd 使用 ET 模式
        }
        else if(evs[i].events & EPOLLIN)
        {
            printf("read event trigger ! \n");
            // int recv( _In_ SOCKET s, _Out_ char *buf, _In_ int len, _In_ int flags );
            while(1)
            {
                // 非阻塞地读
                memset(buf, 0, BUF_SIZE);
                int recv_ret = recv(sock_fd, buf, BUF_SIZE-1, 0);
                if(recv_ret < 0)
                {
                    if(errno == EAGAIN || errno == EWOULDBLOCK)
                    {
                        printf("read at last !\n");
                        break;
                    }
                    close(sock_fd);
                    break;
                }
                else if(recv_ret == 0)
                {
                    close(sock_fd);
                }
                else
                {
                    printf("get %d bytes of content : %s\n", recv_ret, buf);
                }
            }
        }
        else
        {
            printf("other thing happend ... \n");
        }
    }
}


int main(int argc, char* argv[])
{
    if(argc != 2)
    {
        printf("Usage: ./server [port > 1024]\n");
        return 1;
    }

    // 1, 获取监听套接字
    int listen_sock = _startUp(atoi(argv[1]));

    // 2, 设置 event 数组, 创建epoll模型, 注册监听套接字
    // setEventArr_SignInListen()
    struct epoll_event evs[MAX_EVENT_SIZE];
    int epoll_fd = epoll_create(5);
    if(epoll_fd == -1)
    {
        perror("epoll_create");
        return 6;
    }
    // 注册监听套接字
    _epoll_add(epoll_fd, listen_sock, 1);

    // 3, 开始循环等待, 连接, 服务
    while(1)
    {
        int epoll_wait_ret = epoll_wait(epoll_fd, evs, MAX_EVENT_SIZE, -1);
        if(epoll_wait_ret == -1)
        {
            perror("epoll_wait_ret");
            return 7;
        }

        // 4, 使用 LT 或 ET 模式
        //lt(evs, epoll_wait_ret, epoll_fd, listen_sock);
        et(evs, epoll_wait_ret, epoll_fd, listen_sock);
    }
    close(listen_sock);
    return 0;
}

这里写图片描述

这里写图片描述

由上图就可以看出, LT 模式下, 一次没读完数据, 下一次还可以接着读, epoll_wait 也每次都返回, 而在 ET 模式下, 一次就把数据读完了, epoll_wait 只返回一次.

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值