目录
1. epoll和select的区别
I/O多路有select和epoll。
select当有事件发生时,会去轮训检查加入的1-max的全部监控集合的描述符,找到发生事件的fd。显而易见,当待监控连接是数以十万计的,返回的只是数百个活跃连接事件,这就是低效率的表现。可见,处理并发上万个连接时,select就完全力不从心了。
epoll同样可以实现select做的事情,而且更高效。
- 返回 == epoll_fd描述符
- poll_create() epoll_ctrl(epoll_fd描述符,添加或者删除待监控的连接fd)
- 返回事件的活跃连接fd == epoll_wait( epoll描述符 )
与select相比,epoll只会返回发生事件的events集合和发生事件的数量,效率高。
2. epool提供的函数
2.1 epoll_create
#include <sys/epoll.h>
int epoll_create(int size)
函数说明:
参数size:必须设置一个大于0的值。
返回值:调用成功返回一个非负值的文件描述符fd,调用失败返回-1。
2.2 epoll_ctl
有了epoll_fd之后,我们需要将我们需要检测事件的其他fd绑定到这个epoll_fd上,或者修改一个已经绑定上去的fd的事件类型,或者在不需要时将fd从epollfd上解绑,需要使用epoll_ctl函数。
#include <sys/epoll.h>
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
函数说明:
- 参数epfd:调用epoll_create函数创建的epoll_fd。
- 参数op:操作类型,取值有EPOLL_CTL_ADD、EPOLL_CTL_MOD和EPOLL_CTL_DEL,分别表示向epoll_fd上添加、修改和移除一个其他fd,当取值是EPOLL_CTL_DEL,第四个参数event忽略不计,可以设置为NULL。
- 参数fd:即需要被操作的fd。
- 参数event:是一个epoll_event结构体的地址,epoll_event结构体定义下面会详细介绍。
- 返回值:调用成功返回0,调用失败返回-1,可以通过errno错误码获取具体的错误原因。
epoll_event结构体定义如下:
struct epoll_event {
uint32_t events; // 需要检测的fd事件,取值与poll函数一样
epoll_data_t data; // 用户自定义数据
};
typedef union epoll_data {
void *ptr;
int fd; //监控的fd
uint32_t u32;
uint64_t u64;
} epoll_data_t;
epoll_event支持的事件宏如下表:
事件宏 | 描述 |
EPOLLIN | 数据可读(包括普通数据&优先数据) |
EPOLLOUT | 数据可写(包括普通数据&优先数据) |
EPOLLRDHUP | TCP连接被对端关闭,或者关闭了写操作 |
EPOLLPRI | 高优先级数据可读,例如TCP带外数据 |
EPOLLERR | 错误 |
EPOLLHUP | 挂起 |
EPOLLET | 边缘触发模式 |
EPOLLONESHOT | 最多触发其上注册的事件一次 |
2.3 epoll_wait
创建了epoll_fd,设置好某个fd上需要检测事件并将该fd绑定到epoll_fd上去后,就调用epoll_wait检测事件了。
#include <sys/epoll.h>
int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
函数说明:
- 参数epfd:调用epoll_create函数创建的epoll_fd。
- 参数events:是一个epoll_event结构数组的首地址,这是一个输出参数,函数调用成功后,events中存放的是与就绪事件相关epoll_event结构体数组。
- 参数maxevents:数组元素的个数。
- 参数timeout:超时时间,单位是毫秒,如果设置为0,epoll_wait会立即返回。-1 阻塞等待,有事件循环。>0 定时,毫秒。
- 返回值:调用成功会返回有事件的fd数目;如果返回0表示超时;调用失败返回-1。
3. LT模式和ET模式
设置方式
ev.events = EPOLLIN;//使用默认LT模式
ev.events = EPOLLIN|EPOLLET;//监听读状态同时设置ET模式
LT:(Level_triggered,水平触发):
当被监控的文件描述符上有可读写事件发生时,epoll_wait()会通知处理程序去读写。如果这次没有把数据一次性全部读写完(如读写缓冲区太小),那么下次调用 epoll_wait()时,它还会通知你在没读写完的文件描述符上继续读写,当然如果你一直不去读写,它会一直通知你,如果系统中有大量你不需要读写的就绪文件描述符,而它们每次都会返回,这样会大大降低处理程序检索自己关心的就绪文件描述符的效率。
当接收buffer长度小于接收缓存区数据的长度时,会分包,会连续出发事件多次,循环recv,直到接收完。
ET:(Edge_triggered,边缘触发):
当被监控的文件描述符上有可读写事件发生时,epoll_wait()会通知处理程序去读写。如果这次没有把数据全部读写完(如读写缓冲区太小),那么下次调用epoll_wait()时,它不会通知你,也就是它只会通知你一次,直到该文件描述符上出现第二次可读写事件才会通知你,这种模式比水平触发效率高,系统不会充斥大量你不关心的就绪文件描述符。
4. 程序代码
#include <stdio.h>
#include <sys/socket.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <fcntl.h>
#include <unistd.h>
#include <pthread.h>
#include <sys/epoll.h>
#include <string.h>
#define BUFFER_LENGTH 8196
#define EVENTS_LENGTH 128
char rbuffuf[BUFFER_LENGTH] = {0};
char wbuffuf[BUFFER_LENGTH] = {0};
int main() {
// block
int listenfd = socket(AF_INET, SOCK_STREAM, 0); //
if (listenfd == -1) return -1;
// listenfd
struct sockaddr_in servaddr;
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
servaddr.sin_port = htons(9999);
if (-1 == bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr))) {
return -2;
}
//fd --> epoll
int epfd = epoll_create(1); //只需大于零
struct epoll_event ev, events[EVENTS_LENGTH];
ev.events = EPOLLIN;
ev.data.fd = listenfd;
epoll_ctl(epfd, EPOLL_CTL_ADD, listenfd, &ev); //epoll非阻塞
printf("fd : %d , %d \n", epfd, listenfd);
while(1){
int nready = epoll_wait(epfd, events, EVENTS_LENGTH, 1000);
printf("----- nready = %d\n", nready);
int i = 0;
for(i = 0; i<nready; i++){
int clientfd = events[i].data.fd; //发生事件的fd.
if(listenfd == clientfd){ //sever
struct sockaddr_in client;
socklen_t len = sizeof(client);
int counfd = accept(listenfd, (struct sockaddr*)&client, &len);
if(counfd == -1)break;
printf("accept = %d \n" , counfd);
ev.events = EPOLLIN ;
ev.data.fd = counfd;
epoll_ctl(epfd, EPOLL_CTL_ADD, counfd, &ev); //epoll非阻塞
}
else if(events[i].events & EPOLLIN){ //client 读
int n = recv(clientfd, rbuffuf, BUFFER_LENGTH, 0);
if(n > 0){
rbuffuf[n] = '\0';
printf("recv = %s, n =%d\n", rbuffuf, n);
memcpy(wbuffuf, rbuffuf , BUFFER_LENGTH);
ev.events = EPOLLOUT ;
ev.data.fd = clientfd;
epoll_ctl(epfd, EPOLL_CTL_MOD, clientfd , &ev);
}
}
else if(events[i].events & EPOLLOUT){ //写
int sendlen = send(clientfd, wbuffuf, BUFFER_LENGTH, 0);
printf("sendlen =%d\n", sendlen);
ev.events = EPOLLIN ;
ev.data.fd = clientfd;
epoll_ctl(epfd, EPOLL_CTL_MOD, clientfd , &ev);
}
}
}
}
总结
- epoll监视的描述符数量不受限制
- epoll不同于select和poll轮询的方式,而是通过每个fd定义的回调函数来实现的,只有就绪的fd才会执行回调函数。
一般在fd数量比较多,但某段时间内,就绪事件fd数量较少的情况下,epoll才会体现出它的优势,也就是说socket连接数量较大时而活跃连接较少时epoll模型更高效。