epoll 机制相比较 select 和 poll 机制的优势
- 不需要维护文件描述符列表,不用轮询事件,所有的文件描述符事件操作交由内核完成,只需要等待内核通知就好
- 时间复杂度为O(1)
- 可监控的文件描述符几乎没有限制,轻易支持高并发
epoll 相关API函数说明
epoll_create
int epoll_create(int size);
- 参数 size 没有实际意义,要求传入的参数大于0
- 该函数执行成功后,会返回一个二五年文件描述符(epfd),该文件描述符标志在内核里创建epoll实例,之后的 epoll 相关API 都需要使用这个文件描述符才能访问 epoll 相关功能
epoll_ctl
int epoll_ctl(int epfd,int op,int sockfd,struct epoll_event *event);
- 参数 epfd 由
epoll_create()
创建产生的文件描述符 - 参数 op 操作类型
操作类型 | 说明 |
---|---|
EPOLL_CTL_ADD | 注册新的fd到epfd中 |
EPOLL_CTL_MOD | 修改已经注册的fd的监听事件 |
EPOLL_CTL_DEL | 从epfd中删除一个fd |
- 参数 sockfd 向 epfd 实例中关联的 socket 文件描述符
- 参数 event epoll 事件相关入参
struct epoll_event 结构体说明
typedef union epoll_data{ // epoll 事件的相关数据 联合体
void* ptr; // 在 nginx 的 epoll 机制中,只使用到了此成员
int fd;
__uint32_t u32;
__uint64_t u64;
}epoll_data_t;
struct epoll_event{ // epoll 事件结构体
uint32_t events; // 事件标志位
epoll_data_t data; // 事件相关数据
};
在 epoll_event 结构体中,包含两个成员变量,一个是 data ,用来存储事件相关的数据,当事件发生时用户可以从这里拿来数据直接使用;
另外一个成员变量 events 是一个标志量,以位操作(bit set)指定了与 socket 关联的具体使事件,该标志位可以使用如下的宏进行配置。
事件类型 | 说明 |
---|---|
EPOLLIN | 读事件(read ready) |
EPOLLOUT | 写事件(write ready) |
EPOLLRDHUP | 客户端关闭链接(对应的文件描述符被挂断) |
EPOLLPRI | 对应的文件描述符有紧急的数据可读 |
EPOLLERR | 对应的文件描述符发生错误 |
EPOLLET | 将 EPOLL 设置为边缘触发(Edge Triggered)模式 |
EPOLLONESHOT | 只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个 socket的话,需要再次把这个 socket 加入到EPOLL队列里 |
ET 和 LT
ET Edge Triggered 边缘触发
高速模式
只支持**非阻塞socket(no_block_socket)**调用
需要在 epoll_ctl()
函数中添加事件时使用标志位EPOLLET
启用
LT Level Triggered 水平触发
默认模式 也成为低速模式
支持阻塞(blocksocket)和非阻塞socket调用
epoll_wait
int epoll_wait(int epfd,struct epoll_event *events,int maxevents,int timeout);
- 参数 epfd 由
epoll_create()
创建产生的文件描述符 - 参数events 一个数组,长度为 maxevents,表明此次调用最多可以收集到 maxevents 个已经就绪的读写事件,实际的事件数由函数返回值决定
- 参数timeout 指
epoll_wait()
阻塞等待的时间,单位是毫秒,只有在没有任何事件发生时才会阻塞,如果内核事件表中有事件就不会阻塞而是立即返回,因此 timeout 只是一个可能会阻塞等待的最长时间,不是绝对的阻塞时间
epoll 机制的高效体现在 Linux 内核只会拷贝已经就绪(ready)的事件来完成处理
测试代码
这里提供一份使用 epoll 机制实现的tcp server 服务器源码。可供学习 epoll 相关API参考。
编译
gcc -o epoll_test epoll.c
源码
// epoll.c
#include <sys/socket.h>
#include <sys/epoll.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdio.h>
#include <errno.h>
#include <stdlib.h>
#include <string.h>
#define MAXLINE 100
#define OPEN_MAX 100
#define LISTENQ 20
#define SERV_PORT 5555
#define INFTIM 1000
void setnonblocking(int sock)
{
int opts;
opts = fcntl(sock, F_GETFL);
if(opts < 0) {
perror("fcntl(sock, GETFL)");
exit(1);
}
opts = opts | O_NONBLOCK;
if(fcntl(sock, F_SETFL, opts) < 0) {
perror("fcntl(sock, SETFL, opts)");
exit(1);
}
}
int main(int argc, char *argv[])
{
printf("epoll socket test start.\n");
int i, maxi, listenfd, connfd, sockfd, epfd, nfds;
ssize_t n;
char line[MAXLINE];
socklen_t clilen;
struct epoll_event ev, events[20];
epfd = epoll_create(256);
struct sockaddr_in clientaddr;
struct sockaddr_in serveraddr;
listenfd = socket(AF_INET, SOCK_STREAM, 0);
setnonblocking(listenfd);
ev.data.fd = listenfd;
ev.events = EPOLLIN | EPOLLET;
epoll_ctl(epfd, EPOLL_CTL_ADD, listenfd, &ev);
bzero(&serveraddr, sizeof(serveraddr));
serveraddr.sin_family = AF_INET;
char *local_addr = "192.168.6.151";
inet_aton(local_addr, &(serveraddr.sin_addr));
serveraddr.sin_port = htons(SERV_PORT);
bind(listenfd, (struct sockaddr *)&serveraddr, sizeof(serveraddr));
listen(listenfd, LISTENQ);
maxi = 0;
for(; ;) {
nfds = epoll_wait(epfd, events, 20, 500);
for(i = 0; i < nfds; ++i) {
if(events[i].data.fd == listenfd) {
printf("accept connection, fd is %d\n", listenfd);
connfd = accept(listenfd, (struct sockaddr *)&clientaddr, &clilen);
if(connfd < 0) {
perror("connfd < 0");
exit(1);
}
setnonblocking(connfd);
char *str = inet_ntoa(clientaddr.sin_addr);
printf("connect from %s\n", str);
ev.data.fd = connfd;
ev.events = EPOLLIN | EPOLLET;
epoll_ctl(epfd, EPOLL_CTL_ADD, connfd, &ev);
}
else if(events[i].events & EPOLLIN) {
if((sockfd = events[i].data.fd) < 0) continue;
if((n = read(sockfd, line, MAXLINE)) < 0) {
if(errno == ECONNRESET) {
close(sockfd);
events[i].data.fd = -1;
printf("client disconnet");
} else {
printf("readline error");
}
} else if(n == 0) {
close(sockfd);
events[i].data.fd = -1;
}else if(n>0)
{
printf("received data: %s\n", line);
ev.data.fd = sockfd;
ev.events = EPOLLOUT | EPOLLET;
epoll_ctl(epfd, EPOLL_CTL_MOD, sockfd, &ev);
}
}
else if(events[i].events & EPOLLOUT) {
sockfd = events[i].data.fd;
write(sockfd, line, n);
printf("written data: %s\n", line);
ev.data.fd = sockfd;
ev.events = EPOLLIN | EPOLLET;
epoll_ctl(epfd, EPOLL_CTL_MOD, sockfd, &ev);
}
}
}
}