转自:http://blog.csdn.net/rao_warrior/article/details/8753537
select/epoll的特点
select的特点:select 选择句柄的时候,是遍历所有句柄,也就是说句柄有事件响应时,select需要遍历所有句柄才能获取到哪些句柄有事件通知,因此效率是非常低。但是如果连接很少的情况下, select和epoll的LT触发模式相比, 性能上差别不大。
这 里要多说一句,select支持的句柄数是有限制的, 同时只支持1024个,这个是句柄集合限制的,如果超过这个限制,很可能导致溢出,而且非常不容易发现问题, TAF就出现过这个问题, 调试了n天,才发现:)当然可以通过修改linux的socket内核调整这个参数。
epoll的特点:epoll对于句柄事件的选择不是遍历的,是事件响应的,就是句柄上事件来就马上选择出来,不需要遍历整个句柄链表,因此效率非常高,内核将句柄用红黑树保存的。相比于select,epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中,它是采用轮询来处理的,轮询的fd数目越多,自然耗时越多。并且,在linux/posix_types.h头文件有这样的声明:
#define __FD_SETSIZE 1024
表示select最多同时监听1024个fd,当然,可以通过修改头文件再重编译内核来扩大这个数目,但这似乎并不治本。
对于epoll而言还有ET和LT的区别,LT表示水平触发,ET表示边缘触发,两者在性能以及代码实现上差别也是非常大的。
epoll的LT和ET的区别
LT:水平触发,效率会低于ET触发,尤其在大并发,大流量的情况下。但是LT对代码编写要求比较低,不容易出现问题。LT模式服务编写上的表现是:只要有数据没有被获取,内核就不断通知你,因此不用担心事件丢失的情况。
ET:边缘触发,效率非常高,在并发,大流量的情况下,会比LT少很多epoll的系统调用,因此效率高。但是对编程要求高,需要细致的处理每个请求,否则容易发生丢失事件的情况。
epoll相关API
epoll的接口非常简单,一共就三个函数:
1. int epoll_create(int size);
创建一个epoll的句柄,size用来告诉内核这个监听的数目一共有多大。这个参数不同于select()中的第一个参数,给出最大监听的fd+1的值。需要注意的是,当创建好epoll句柄后,它就是会占用一个fd值,在linux下如果查看/proc/进程id/fd/,是能够看到这个fd的,所以在使用完epoll后,必须调用close()关闭,否则可能导致fd被耗尽。2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件注册函数,它不同与select()是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。第一个参数是epoll_create()的返回值,第二个参数表示动作,用三个宏来表示:EPOLL_CTL_ADD:注册新的fd到epfd中;
EPOLL_CTL_MOD:修改已经注册的fd的监听事件;
EPOLL_CTL_DEL:从epfd中删除一个fd;
第三个参数是需要监听的fd,第四个参数是告诉内核需要监听什么事,struct epoll_event结构如下:
typedef union epoll_data {
void *ptr;
int fd;
__uint32_t u32;
__uint64_t u64;
} epoll_data_t;
struct epoll_event {
__uint32_t events; /* Epoll events */
epoll_data_t data; /* User data variable */
};
events可以是以下几个宏的集合:
EPOLLIN :表示对应的文件描述符可以读(包括对端SOCKET正常关闭);
EPOLLOUT:表示对应的文件描述符可以写;
EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);
EPOLLERR:表示对应的文件描述符发生错误;
EPOLLHUP:表示对应的文件描述符被挂断;
EPOLLET: 将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的。
EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里
3. int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
等待事件的产生,类似于select()调用。参数events用来从内核得到事件的集合,maxevents告之内核这个events有多大,这个 maxevents的值不能大于创建epoll_create()时的size,参数timeout是超时时间(毫秒,0会立即返回,-1将不确定,也有说法说是永久阻塞)。该函数返回需要处理的事件数目,如返回0表示已超时。
示例代码
epoll服务器
- #include <sys/epoll.h>
- #include <netinet/in.h>
- #include <sys/types.h> /* See NOTES */
- #include <sys/socket.h>
- #include <string.h>
- #include <stdio.h>
- #include <unistd.h>
- #include <fcntl.h>
- #include <errno.h>
- #include <stdlib.h>
- typedef struct sockaddr_in sockaddr_in ;
- typedef struct sockaddr sockaddr ;
- #define SER_PORT 8080
- int nonblock(int fd){
- int opt ;
- opt = fcntl(fd,F_GETFL);
- opt |= O_NONBLOCK ;
- return fcntl(fd,F_SETFL,opt);
- }
- int main(int argc,char**argv){
- sockaddr_in srv, cli ;
- int listen_fd ,con_fd ;
- socklen_t len;
- int res ,nsize,ws;
- char buf[255];
- int epfd,ers;
- struct epoll_event evn,events[50];
- int i;
- bzero(&srv,sizeof(srv));
- bzero(&cli,sizeof(cli));
- srv.sin_port= SER_PORT ;
- srv.sin_family = AF_INET ;
- listen_fd = socket(AF_INET,SOCK_STREAM,0);
- int yes = 1;
- setsockopt(listen_fd,SOL_SOCKET,SO_REUSEADDR,&yes,sizeof(int));
- if(bind(listen_fd,(sockaddr*)&srv,sizeof(sockaddr))<0) {
- perror("bind");
- exit(0);
- }
- listen(listen_fd,100);
- nonblock(listen_fd);
- epfd = epoll_create(200);
- evn.events = EPOLLIN|EPOLLET ;
- evn.data.fd = listen_fd;
- epoll_ctl(epfd,EPOLL_CTL_ADD,listen_fd,&evn);
- static int count ;
- while(1){
- ers = epoll_wait(epfd,events,100,5000);
- if(ers<0 ){
- perror("epoll_wait:");exit(0);
- }else if(ers==0){
- printf("time out:%d\n",count++);
- continue ;
- }
- for(i=0;i<ers;i++){
- if(events[i].data.fd == listen_fd){
- con_fd = accept(listen_fd,(sockaddr*)&cli ,&len);
- nonblock(con_fd);
- printf("connect from:%s\n",inet_ntoa(cli.sin_addr));
- evn.data.fd = con_fd;
- evn.events = EPOLLIN | EPOLLET ;
- epoll_ctl(epfd,EPOLL_CTL_ADD,con_fd,&evn);
- }else if(events[i].events & EPOLLIN){
- nsize = 0;
- while((res=read(events[i].data.fd,buf+nsize,sizeof(buf)-1))>0){
- nsize+= res;
- }
- if(res==0){
- epoll_ctl(epfd,EPOLL_CTL_DEL,events[i].data.fd,NULL);
- printf("a client over\n");
- close(con_fd);
- continue ;
- }else if(res<0 && errno!=EAGAIN){
- perror("read");
- continue ;
- }
- buf[nsize]=0;
- evn.data.fd = events[i].data.fd;
- evn.events=EPOLLOUT|EPOLLET ;
- epoll_ctl(epfd,EPOLL_CTL_MOD,events[i].data.fd,&evn);
- }else if(events[i].events & EPOLLOUT){
- nsize = strlen(buf);
- ws = 0;
- while(nsize>0){
- ws=write(events[i].data.fd,buf,nsize);
- nsize-=ws;
- }
- evn.data.fd = events[i].data.fd;
- evn.events=EPOLLIN|EPOLLET ;
- epoll_ctl(epfd,EPOLL_CTL_MOD,events[i].data.fd,&evn);
- }else{
- printf("others\n");
- }
- }
- }
- close(listen_fd);
- return 0;
- }
客户端测试代码:
- #include <sys/epoll.h>
- #include <netinet/in.h>
- #include <sys/types.h> /* See NOTES */
- #include <sys/socket.h>
- #include <strings.h>
- #include <stdio.h>
- #include <stdlib.h>
- #include <unistd.h>
- typedef struct sockaddr_in sockaddr_in ;
- typedef struct sockaddr sockaddr ;
- #define SER_PORT 8080
- #define IP_ADDR "10.33.28.230"
- int main(int argc,char**argv){
- sockaddr_in srv, cli ;
- int listen_fd ,con_fd ;
- socklen_t len;
- int res,ws ;
- char buf[255];
- bzero(&srv,sizeof(srv));
- bzero(&cli,sizeof(cli));
- srv.sin_port= SER_PORT ;
- srv.sin_family = AF_INET ;
- inet_pton(AF_INET,IP_ADDR,&srv.sin_addr);
- listen_fd = socket(AF_INET,SOCK_STREAM,0);
- if(connect(listen_fd,(sockaddr*)&srv,sizeof(sockaddr))<0){
- perror("connect");
- exit(0);
- }
- while(1){
- res = read(STDIN_FILENO,buf,sizeof(buf)-1);
- ws = write(listen_fd,buf,res);
- res = read(listen_fd,buf,sizeof(buf)-1);
- ws = write(STDOUT_FILENO,buf,res);
- }
- close(listen_fd);
- return 0;
- }
参考:
http://www.kuqin.com/linux/20120912/330528.htm
http://blog.sina.com.cn/s/blog_81c2545a01018m78.html