什么是epoll
epoll是什么?按照man手册的说法:是为处理大批量句柄而作了改进的poll。当然,这不是2.6内核才有的,它是在2.5.44内核中被引进的(epoll(4) is a new API introduced in Linux kernel2.5.44),它几乎具备了之前所说的一切优点,被公认为Linux2.6下性能最好的多路I/O就绪通知方法。
epoll的相关系统调用
epoll只有epoll_create,epoll_ctl,epoll_wait 3个系统调用。
1. int epoll_create(int size);
创建一个epoll的句柄。自从linux2.6.8之后,size参数是被忽略的。需要注意的是,当创建好epoll句柄后,它就是会占用一个fd值,在linux下如果查看/proc/进程id/fd/,是能够看到这个fd的,所以在使用完epoll后,必须调用close()关闭,否则可能导致fd被耗尽。
2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件注册函数,它不同于select()是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。第一个参数是epoll_create()的返回值。第二个参数表示动作,用三个宏来表示:EPOLL_CTL_ADD:注册新的fd到epfd中;
EPOLL_CTL_MOD:修改已经注册的fd的监听事件;
EPOLL_CTL_DEL:从epfd中删除.一个fd;
第三个参数是需要监听的fd。
第四个参数是告诉内核需要监听什么事,struct epoll_event结构如下:
events可以是以下几个宏的集合:
EPOLLIN :表示对应的文件描述符可以读(包括对端SOCKET正常关闭);
EPOLLOUT:表示对应的文件描述符可以写;
EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);
EPOLLERR:表示对应的文件描述符发生错误;
EPOLLHUP:表示对应的文件描述符被挂断;
EPOLLET: 将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(LevelTriggered)来说的。
EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加⼊入到EPOLL队列里
3. int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
收集在epoll监控的事件中已经发送的事件。参数events是分配好的epoll_event结构体数组,epoll将会把发生的事件赋值到events数组中(events不可以是空指针,内核只负责把数据复制到这个events数组中,不会去帮助我们在用户态中分配内存)。maxevents告之内核这个
events有多大,这个 maxevents的值不能大于创建epoll_create()时的size,参数timeout是超时时间(毫秒,0会立即返回,-1将不确定,也有说法说是永久阻塞)。如果函数调用成功,返回对应I/O上已准备好的⽂文件描述符数目,如返回0表示已超时。
epoll.c代码
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<unistd.h>
#include<sys/types.h>
#include<sys/socket.h>
#include<netinet/in.h>
#include<arpa/inet.h>
#include<sys/epoll.h>
#define _SIZE_ 10240
typedef struct epbuf{
int fd;
char buf[_SIZE_];
}epbuf_t,*epbuf_p,**epbuf_pp;
static epbuf_p alloc_epbuf(int fd)
{
epbuf_p ptr=(epbuf_p)malloc(sizeof(epbuf_t));
if(ptr==NULL)
{
perror("malloc");
exit(1);
}
ptr->fd=fd;
return ptr;
}
static void del_epbuf(epbuf_p ptr)
{
if(ptr!=NULL)
{
free(ptr);
}
}
int startup(const char* _ip,int _port)
{
int sock=socket(AF_INET,SOCK_STREAM,0);
if(sock<0)
{
perror("socket");
exit(2);
}
int opt=1;
setsockopt(sock,SOL_SOCKET,SO_REUSEADDR,&opt,sizeof(opt));
struct sockaddr_in local;
local.sin_family=AF_INET;
local.sin_port=htons(_port);
local.sin_addr.s_addr=inet_addr(_ip);
if(bind(sock,(struct sockaddr*)&local,sizeof(local))<0)
{
perror("bind");
exit(3);
}
if(listen(sock,5)<0)
{
perror("listen");
exit(4);
}
return sock;
}
int main(int argc,char* argv[])
{
if(argc!=3)
{
printf("Usage: %s ip_local,port_local\n",argv[0]);
return 1;
}
int listen_sock=startup(argv[1],atoi(argv[2]));
int epfd=epoll_create(256);
if(epfd<0)
{
perror("epoll_create");
return 5;
}
struct epoll_event _ev;
_ev.events=EPOLLIN|EPOLLET;
_ev.data.ptr=alloc_epbuf(listen_sock);
epoll_ctl(epfd,EPOLL_CTL_ADD,listen_sock,&_ev);
while(1)
{
int nums=0;
struct epoll_event evs[32];
int max_evs=32;
int timeout=-1;
switch((nums=epoll_wait(epfd,evs,max_evs,timeout)))
{
case 0:
printf("timeout\n");
break;
case -1:
perror("epoll_wait");
break;
default:
{
int i=0;
for(;i<nums;i++){
int fd=((epbuf_p)(evs[i].data.ptr))->fd;
if(fd==listen_sock&&(evs[i].events&EPOLLIN))
{
struct sockaddr_in peer;
socklen_t len=sizeof(peer);
int new_sock=accept(fd,\
(struct sockaddr*)&peer,\
&len);
if(new_sock<0)
{
perror("accept");
continue;
}
_ev.events=EPOLLIN;
_ev.data.ptr=alloc_epbuf(new_sock);
epoll_ctl(epfd,EPOLL_CTL_ADD,new_sock,&_ev);
}
else if(fd!=listen_sock&&\
(evs[i].events&EPOLLIN)){
char* buf=((epbuf_p)(evs[i].data.ptr))->buf;
ssize_t _s=read(fd,buf,_SIZE_-1);
if(_s>0)
{
buf[_s]=0;
printf("%s\n",buf);
_ev.events=EPOLLOUT;
epoll_ctl(epfd,EPOLL_CTL_MOD,fd,&_ev);
}
else if(_s==0)
{
del_epbuf(evs[i].data.ptr);
evs[i].data.ptr=NULL;
epoll_ctl(epfd,EPOLL_CTL_DEL,fd,NULL);
close(fd);
printf("client is quit!\n");
}
else{
perror("read");
}
}
else if(fd!=listen_sock&&(evs[i].events&EPOLLOUT)){
const char* msg="HTTP/1.0 200 OK\r\n\r\n<html><h1>hello world</h1></html>\n";
write(fd,msg,strlen(msg));
del_epbuf(evs[i].data.ptr);
evs[i].data.ptr=NULL;
epoll_ctl(epfd,EPOLL_CTL_DEL,fd,NULL);
close(fd);
}
else
{
}
}
}
break;
}
}
return 0;
}