I/O多路复用三种方式比较

select模型

三个功能:

  • 监控
  • 添加描述符
  • 移除描述符

通过对大量事件集合中的描述符阻塞进行各自的事件监控;
当对应集合中有描述符事件就绪/超时则返回事件就绪,描述符当前可读/可写/异常;
返回之前将集合中没有就绪的描述符全部删除;

int select(int nfds, fd_set* readfds, fd_set* writefds, fd_set* exceptfds, struct timeval* timeout);

nfds:等于监控的描述符中,最大的那个描述符+1;

fd_set:描述符集合                  
readfds:读事件集合               
writefds:写事件集合
exceptfds:异常事件集合

timeout:select等待的超时时间

返回值:
小于0>监控出错
等于0>等待超时
大于0>当前有多少个描述符就绪

1、定义fd_set:
描述符集合(是一个位图,位图大小取决于_FD_SETSIZE = 1024)

2、监控:
将集合拷贝到内核进行监控,监控的原理是对所有的描述符进行轮询遍历状态;

3、移除操作符
当有描述符就绪的时候,在调用返回之前将集合中没有就绪的描述符剔除出去;

4、用户操作:
对所有的描述符进行遍历,查看哪一个还在集合中,那么这个描述符就已经就绪

void FD_CLR(int fd, fd_set* set);    //将指定的描述符在集合中移除
int FD_ISSET(int fd, fd_set* set);    //判断指定的描述符是否在集合中
void FD_SET(int fd, fd_set* set);    //将指定的描述符添加到监控集合中
void FD_ZERO(fd_set* set);            //清空描述符集合

优点:

  • select遵循POSIX,可以跨平台——移植性强
  • 监控的超时时间更加精细——微秒

缺点:

  • 所能监控的描述符是有上限的(默认:1024,取决于_FD_SETSIZE = 1024)
  • select实现监控原理是在内核中进行轮询遍历状态,因此性能会随着描述符增多而下降
  • select每次监控返回时会修改描述符集合(移除未就绪的描述符),需要每次监控时重新添加到描述符集合中
  • select要监控的集合中的描述符数据,需要每次重新向内核中拷贝
  • 不会告诉用户哪一个描述符就绪,只是告诉用户有就绪事件,需要用户遍历查找

poll模型:

poll本质上和select没有区别;

int poll(struct pollfd *fds, nfds_t nfds, int timeout)
                    
fds:事件数组
                    
nfds:监控事件个数
                    
timeout:超时等待时间

监控实现原理:
1.用户定义一个事件数组,对描述符可以添加关心的事件,进行监控;

 // pollfd结构
struct pollfd {   
      int   fd;            /* 用户监控的文件描述符 */   
      short events;         /* 保存用户关心的事件 */   
       /*(POLLIN / POLLOUT)*/
      short revents;        /* 保存当前就绪事件 */
      };

2.poll实现监控的原理也是将事件结构拷贝到内核,然后进行轮询遍历监控,性能随着描述符的增多而下降;

3.若有描述符就绪,则修改这个响应描述符事件结构中的实际就绪事件

4.用户根据返回的revents判断哪一个事件就绪,然后进行操作即可

5.poll也不会告诉用户哪一个描述符就绪,只是告诉用户有就绪事件,需要用户遍历查找

优点:

  • 采用事件结构的方式对描述符进行监控,简化了多个事件集合的监控方式
  • 没有描述符的具体监控上限

缺点:

  • 不能跨平台
  • poll采用轮询遍历的方式判断就绪,性能随着描述符的增多而下降
  • 不会告诉用户哪一个描述符就绪,只是告诉用户有就绪事件,需要用户遍历查找

epoll模型

基础知识

epoll是在2.6内核中提出的,是之前的select和poll的增强版本。

相对于select和poll来说,epoll更加灵活,没有描述符限制。

epoll使用一个文件描述符管理多个描述符,将用户关系的文件描述符的事件存放到内核的一个事件表中,这样在用户空间和内核空间的copy只需一次。

epoll接口

epoll操作过程需要三个接口,分别如下:

#include <sys/epoll.h>

int epoll_create(int size);
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);

1、int epoll_create(int size);
  创建一个epoll的句柄,size用来告诉内核这个监听的数目一共有多大。这个参数不同于select()中的第一个参数,给出最大监听的fd+1的值。需要注意的是,当创建好epoll句柄后,它就是会占用一个fd值,在linux下如果查看/proc/进程id/fd/,是能够看到这个fd的,所以在使用完epoll后,必须调用close()关闭,否则可能导致fd被耗尽。

2、int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
  epoll的事件注册函数,它不同与select()是在监听事件时告诉内核要监听什么类型的事件epoll的事件注册函数,它不同与select()是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。
  
第一个参数是epoll_create()的返回值;

第二个参数表示动作,用三个宏来表示:

  • EPOLL_CTL_ADD:注册新的fd到epfd中;
  • EPOLL_CTL_MOD:修改已经注册的fd的监听事件;
  • EPOLL_CTL_DEL:从epfd中删除一个fd;

第三个参数是需要监听的fd;

第四个参数是告诉内核需要监听什么事;

struct epoll_event结构如下:

struct epoll_event {
  __uint32_t events;  /* Epoll events */
  epoll_data_t data;  /* User data variable */
};

events可以是以下几个宏的集合:
EPOLLIN :表示对应的文件描述符可以读(包括对端SOCKET正常关闭);
EPOLLOUT:表示对应的文件描述符可以写;
EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);
EPOLLERR:表示对应的文件描述符发生错误;
EPOLLHUP:表示对应的文件描述符被挂断;
EPOLLET: 将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的。
EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里

3、int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
  等待事件的产生,类似于select()调用。参数events用来从内核得到事件的集合,maxevents告之内核这个events有多大,这个maxevents的值不能大于创建epoll_create()时的size,参数timeout是超时时间(毫秒,0会立即返回,-1将不确定,也有说法说是永久阻塞)。该函数返回需要处理的事件数目,如返回0表示已超时。

工作模式

epoll对文件描述符的操作有两种模式:

  • LT(level trigger)(水平触发)
  • ET(edge trigger)(边缘触发)

水平触发

LT(level triggered)是缺省的工作方式,并且同时支持block和no-block socket.在这种做法中,内核告诉你一个文件描述符是否就绪了,然后你可以对这个就绪的fd进行IO操作。如果你不作任何操作,内核还是会继续通知你的,所以,这种模式编程出错误可能性要小一点。传统的select/poll都是这种模型的代表。

  • 优点:
    当进行socket通信的时候,保证了数据的完整输出,进行IO操作的时候,如果还有数据,就会一直的通知你。
  • 缺点:
    由于只要还有数据,内核就会不停的从内核空间转到用户空间,所有占用了大量内核资源,试想一下当有大量数据到来的时候,每次读取一个字节,这样就会不停的进行切换。内核资源的浪费严重。效率来讲也是很低的。

边缘触发

ET(edge-triggered)是高速工作方式,只支持no-block socket。在这种模式下,当描述符从未就绪变为就绪时,内核通过epoll告诉你。然后它会假设你知道文件描述符已经就绪,并且不会再为那个文件描述符发送更多的就绪通知。
请注意,如果一直不对这个fd作IO操作(从而导致它再次变成未就绪),内核不会发送更多的通知(only once)。

  • 优点:
    每次内核只会通知一次,大大减少了内核资源的浪费,提高效率。
  • 缺点:
    不能保证数据的完整。不能及时的取出所有的数据。

应用场景: 处理大数据。使用non-block模式的socket。

由于不会重复触发,所以我们要循环读取数据,以确保把socket读缓存的所有数据取出

原理解释

epoll可以理解为event poll,不同于忙轮询和无差别轮询,epoll之会把哪个流发生了怎样的I/O事件通知我们。此时我们对这些流的操作都是有意义的。(复杂度降低到了O(1))

在讨论epoll的实现细节之前,先把epoll的相关操作列出:

1、epoll_create 创建一个epoll对象,一般:

epollfd = epoll_create()

2、epoll_ctl (epoll_add/epoll_del的合体),往epoll对象中增加/删除某一个流的某一个事件
比如:

epoll_ctl(epollfd, EPOLL_CTL_ADD, socket, EPOLLIN);//注册缓冲区非空事件,即有数据流入
epoll_ctl(epollfd, EPOLL_CTL_DEL, socket, EPOLLOUT);//注册缓冲区非满事件,即流可以被写入

3、epoll_wait(epollfd,…)等待直到注册的事件发生

epoll_wait(epollfd,...);

(注:当对一个非阻塞流的读写发生缓冲区满或缓冲区空,write/read会返回-1,并设置errno=EAGAIN。而epoll只关心缓冲区非满和缓冲区非空事件)。

一个epoll模式的代码大概的样子是:

while(true) 
{
	active_stream[] = epoll_wait(epollfd)
	for i in active_stream[] 
	{
		read or write till
	}
}

总结:

在这里插入图片描述
综上,在选择select,poll,epoll时要根据具体的使用场合以及这三种方式的自身特点。

1、表面上看epoll的性能最好,但是在连接数少并且连接都十分活跃的情况下,select和poll的性能可能比epoll好,毕竟epoll的通知机制需要很多函数回调。

2、select低效是因为每次它都需要轮询。但低效也是相对的,视情况而定,也可通过良好的设计改善

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值