epoll原理分析,图文并茂讲解epoll,彻底弄懂epoll机制

目录

1.epoll基础简介

1.1 相关函数介绍

2.epoll软件架构

3.LT模式和ET模式

3.1 LT模式:水平触发

3.2 ET模式:边缘触发

4.阻塞和非阻塞

5.epoll为什么高效?

6.epoll示例程序

6.1 服务端程序

6.2 客户端程序


往期文章回顾:

IO复用之select

IO复用之poll

UDP编程基础

TCP编程基础

套接字核心函数

套接字地址



1.epoll基础简介

1.1 相关函数介绍

  • epoll_create函数

epoll_create函数用于创建epoll文件描述符,该文件描述符用于后续的epoll操作,参数size目前还没有实际用处,我们只要填一个大于0的数就行。

#include <sys/epoll.h>

int epoll_create(int size);

参数:
size:目前内核还没有实际使用,只要大于0就行

返回值:
返回epoll文件描述符

图 1

  • epoll_ctl函数

epoll_ctl函数用于增加,删除,修改epoll事件,epoll事件会存储于内核epoll结构体红黑树中。

#include <sys/epoll.h>

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

参数:
epfd:epoll文件描述符
op:操作码
EPOLL_CTL_ADD:插入事件
EPOLL_CTL_DEL:删除事件
EPOLL_CTL_MOD:修改事件
fd:事件绑定的套接字文件描述符
events:事件结构体

返回值:
成功:返回0
失败:返回-1

 图 2


struct epoll_event结构体

epoll_event事件结构体

#include <sys/epoll.h>

struct epoll_event{
  uint32_t events; //epoll事件,参考事件列表 
  epoll_data_t data;
} ;
typedef union epoll_data {  
    void *ptr;  
    int fd;  //套接字文件描述符
    uint32_t u32;  
    uint64_t u64;
} epoll_data_t;

epoll事件列表:

头文件:<sys/epoll.h>

enum EPOLL_EVENTS
{
    EPOLLIN = 0x001, //读事件
    EPOLLPRI = 0x002,
    EPOLLOUT = 0x004, //写事件
    EPOLLRDNORM = 0x040,
    EPOLLRDBAND = 0x080,
    EPOLLWRNORM = 0x100,
    EPOLLWRBAND = 0x200,
    EPOLLMSG = 0x400,
    EPOLLERR = 0x008, //出错事件
    EPOLLHUP = 0x010, //出错事件
    EPOLLRDHUP = 0x2000,
    EPOLLEXCLUSIVE = 1u << 28,
    EPOLLWAKEUP = 1u << 29,
    EPOLLONESHOT = 1u << 30,
    EPOLLET = 1u << 31 //边缘触发
  };

  • epoll_wait函数

epoll_wait用于监听套接字事件,可以通过设置超时时间timeout来控制监听的行为为阻塞模式还是超时模式。

#include <sys/epoll.h>

int epoll_wait(int epfd, struct epoll_event *events,              
int maxevents, int timeout);

参数:
epfd:epoll文件描述符
events:epoll事件数组
maxevents:epoll事件数组长度
timeout:超时时间
小于0:一直等待
等于0:立即返回
大于0:等待超时时间返回,单位毫秒

返回值:
小于0:出错
等于0:超时
大于0:返回就绪事件个数

图 3



2.epoll软件架构

图 4

 


3.LT模式和ET模式

3.1 LT模式:水平触发

  • socket读触发:socket接收缓冲区有数据,会一直触发epoll_wait EPOLLIN事件,直到数据被用户读取完。
  • socket写触发:socket可写,会一直触发epoll_wait EPOLLOUT事件。

3.2 ET模式:边缘触发

  • socket读触发:socket数据从无到有,会触发epoll_wait EPOLLIN事件,只会触发一次EPOLLIN事件,用户检测到事件后,需一次性把socket接收缓冲区数据全部读取完,读取完的标志为recv返回-1,errno为EAGAIN。
  • socket写触发:socket可写,会触发一次epoll_wait EPOLLOUT事件。

边缘触发读取数据示例代码:

memset(recv_buf, 0, BUF_SIZE);
unsigned int len = 0;
while(1) {
    ret = recv(fd, recv_buf + len, BUF_SIZE, 0);
    if (ret ==  0) {
        printf("remove fd:%d\n", fd);
        epoll_ctl(efd, EPOLL_CTL_DEL, fd, NULL);
        close(fd);
        break;
    } else if ((ret == -1) && ((errno == EINT macro EINTR     AGAIN) || (errno == EWOULDBLOCK))) {
        printf("fd:%d recv errno:%d done\n",
        break;                                #define EINTR 4
    } else if ((ret == -1) && !((errno == EINTR) || (errno == EAGAIN) || (errno == EWOULDBLOCK))) {
        printf("remove fd:%d errno:%d\n", fd, errno);
        epoll_ctl(efd, EPOLL_CTL_DEL, fd, NULL);
        close(fd);
        break;
    }else {
        len += ret;
    }
    printf("recv fd:%d, len:%d, %s\n", fd, ret, recv_buf);
}


4.阻塞和非阻塞

讨论epoll阻塞和非阻塞得从两方面讨论:epoll阻塞和epoll监听套接字阻塞。

  • epoll阻塞:epoll自身是阻塞的,我们可以通过epoll_wait超时参数设置epoll阻塞行为。
  • epoll监听套接字阻塞:epoll监听套接字阻塞是指插入epoll监听事件的套接字设置为阻塞模式。

epoll监听套接字设置成阻塞还是非阻塞?

这个问题可以肯定的回答是非阻塞,因为epoll是为高并发设计的,任何的其他阻塞行为,都会影响epoll高效运行。


5.epoll为什么高效?

  • 红黑树红黑树提高epoll事件增删查改效率。
  • 回调通知机制

当epoll监听套接字有数据读或者写时,会通过注册到socket的回调函数通知epoll,epoll检测到事件后,将事件存储在就绪队列(rdllist)。

  • 就绪队列

epoll_wait返回成功后,会将所有就绪事件存储在事件数组,用户不需要进行无效的轮询,从而提高了效率。


6.epoll示例程序

6.1 服务端程序

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <stdlib.h>
#include <fcntl.h>
#include <errno.h>
#include <stdbool.h>
#include <sys/epoll.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>

#define LISTEN_BACKLOG (5)
#define BUF_SIZE (2048)
#define ONCE_READ_SIZE (1500)

#define EPOLL_SIZE (100);
#define MAX_EVENTS (10)

void usage(void) {
    printf("*********************************\n");
    printf("./server 本端ip 本端端口\n");
    printf("*********************************\n");
}

void setnonblocking(int fd) {
    int flag = fcntl(fd, F_GETFL, 0);
    fcntl(fd, F_SETFL, flag | O_NONBLOCK);
}

int main(int argc, char *argv[])
{
    struct sockaddr_in local;
    struct sockaddr_in peer;
    socklen_t addrlen = sizeof(peer);
    int sock_fd = 0, new_fd = 0;
    int ret = 0;
    char send_buf[BUF_SIZE] = {0};
    char recv_buf[BUF_SIZE] = {0};

    if (argc != 3) {
        usage();
        return -1;
    }

    char *ip = argv[1];
    unsigned short port = atoi(argv[2]);
    printf("ip:port->%s:%u\n", argv[1], port);

    sock_fd = socket(AF_INET, SOCK_STREAM, 0);
    if (sock_fd == -1) {
        perror("socket error");
        return -1;
    }

    memset(&local, 0, sizeof(struct sockaddr_in));
    local.sin_family = AF_INET;
    local.sin_addr.s_addr = inet_addr(ip);
    local.sin_port = htons(port);

    ret = bind(sock_fd, (struct sockaddr *)&local, sizeof(struct sockaddr));
    if (ret == -1) {
        close(sock_fd);
        perror("bind error");
        return -1;
    }

    ret = listen(sock_fd, LISTEN_BACKLOG);
    if (ret == -1) {
        close(sock_fd);
        perror("listen error");
        return -1;
    }

    int epoll_size = EPOLL_SIZE;
    int efd = epoll_create(epoll_size);
    if (efd == -1) {
        perror("epoll create error");
        return -1;
    }

    struct epoll_event ev, events[MAX_EVENTS];
    ev.data.fd = sock_fd;
    ev.events = EPOLLIN;
    if (epoll_ctl(efd, EPOLL_CTL_ADD, sock_fd, &ev) == -1) {
        perror("epoll ctl ADD error");
        return -1;
    }

    int timeout = 1000;
    while (1) {
        int nfds = epoll_wait(efd, events, MAX_EVENTS, timeout);
        if (nfds == -1) {
            perror("epoll wait error");
            return -1;
        } else if (nfds == 0) {
            printf("epoll wait timeout\n");
            continue;
        } else {

        }

        for (int i = 0; i < nfds; i++) {
            int fd = events[i].data.fd;
            printf("events[%d] events:%08x\n", i, events[i].events);
            if (fd == sock_fd) {
                new_fd = accept(sock_fd, (struct sockaddr *)&peer, &addrlen);
                if (new_fd == -1) {
                    perror("accept error");
                    continue;
                }
                setnonblocking(new_fd);
                ev.data.fd = new_fd;
                ev.events = EPOLLIN|EPOLLET;
                if (epoll_ctl(efd, EPOLL_CTL_ADD, new_fd, &ev) == -1) {
                    perror("epoll ctl ADD new fd error");
                    close(new_fd);
                    continue;
                }
            } else {
                if (events[i].events & EPOLLIN) {
                    printf("fd:%d is readable\n", fd);
                    memset(recv_buf, 0, BUF_SIZE);
                    unsigned int len = 0;
                    while(1) {
                        ret = recv(fd, recv_buf + len, ONCE_READ_SIZE, 0);
                        if (ret ==  0) {
                            printf("remove fd:%d\n", fd);
                            epoll_ctl(efd, EPOLL_CTL_DEL, fd, NULL);
                            close(fd);
                            break;
                        } else if ((ret == -1) && ((errno == EINTR) || (errno == EAGAIN) || (errno == EWOULDBLOCK))) {
                            printf("fd:%d recv errno:%d done\n", fd, errno);
                            break;
                        } else if ((ret == -1) && !((errno == EINTR) || (errno == EAGAIN) || (errno == EWOULDBLOCK))) {
                            printf("remove fd:%d errno:%d\n", fd, errno);
                            epoll_ctl(efd, EPOLL_CTL_DEL, fd, NULL);
                            close(fd);
                            break;
                        }else {
                            printf("once read ret:%d\n", ret);
                            len += ret;
                        }
                    }
                    printf("recv fd:%d, len:%d, %s\n", fd, len, recv_buf);
                } if (events[i].events & EPOLLOUT) {
                    printf("fd:%d is sendable\n", fd);
                } else if ((events[i].events & EPOLLERR) ||
                        ((events[i].events & EPOLLHUP))) {
                    printf("fd:%d error\n", fd);
                }
            }
        }
    }

    return 0;
}


6.2 客户端程序

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <stdlib.h>
#include <fcntl.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>

#define LISTEN_BACKLOG (5)
#define BUF_SIZE (1500)

#define REQUEST_STR "tcp pack"

void usage(void) {
    printf("*********************************\n");
    printf("./client 对端ip 对端端口\n");
    printf("*********************************\n");
}

int main(int argc, char *argv[])
{
    struct sockaddr_in client;
    struct sockaddr_in server;
    int sock_fd = 0;
    int ret = 0;
    socklen_t addrlen = 0;
    char send_buf[BUF_SIZE] = {0};
    char recv_buf[BUF_SIZE] = {0};

    if (argc != 3) {
        usage();
        return -1;
    }

    char *ip = argv[1];
    unsigned short port = atoi(argv[2]);
    printf("ip:port->%s:%u\n", argv[1], port);

    sock_fd = socket(AF_INET, SOCK_STREAM, 0);
    if (sock_fd == -1) {
        perror("socket error");
        return -1;
    }

    memset(&server, 0, sizeof(struct sockaddr_in));
    server.sin_family = AF_INET;
    server.sin_addr.s_addr = inet_addr(ip);
    server.sin_port = htons(port);

    ret = connect(sock_fd, (struct sockaddr *)&server, sizeof(struct sockaddr));
    if (ret == -1) {
        close(sock_fd);
        perror("connect error");
        return -1;
    }

    char seq = 0x31;
    while(1) {
        memset(send_buf, seq, BUF_SIZE);
        send(sock_fd, send_buf, BUF_SIZE, 0);
        printf("send %s\n", send_buf);
        sleep(2);
        seq++;
    }
    
    close(sock_fd);

    return 0;
}

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

物联网心球

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值