对IO多路复用的理解

一、概念

IO多路复用是一种同步机制,通过复用机制实现一个线程监视多个文件句柄,一旦某个文件句柄准备就续,就通知应用程序对文件读写操作。若没有文件句柄就续时会阻塞应用程序,交出cpu。多路是指网络连接,复用指的是同一个线程。

二、非多路IO处理方式

1、同步阻塞(BIO)

 1.1单线程服务端概念

服务端采用单线程,在accpet一个请求之后,在recv或send调用阻塞时,将无法accept其它请求,(必须等上一个请求处recv或send完),无法并发执行任务。

1.2代码逻辑

// 伪代码描述
while(1) {
  // accept阻塞
  client_fd = accept(listen_fd)
  fds.append(client_fd)
  for (fd in fds) {
    // recv阻塞(会影响上面的accept)
    if (recv(fd)) {
      // logic
    }
  }  
}

1.3多线程服务端概念

当accept一个请求后,开启线程执行recv或send,多线程情况下可以并发,但是多线程同时运行会使用大量空间,消耗大量资源,10000个线程真正发生读写事件的线程数不会超过20%,造成了资源浪费。

1.3 代码逻辑

// 伪代码描述
while(1) {
  // accept阻塞
  client_fd = accept(listen_fd)
  // 开启线程read数据(fd增多导致线程数增多)
  new Thread func() {
    // recv阻塞(多线程不影响上面的accept)
    if (recv(fd)) {
      // logic
    }
  }  
}
 

2、同步非阻塞(NIO)

2.1概念

在服务端accept一个请求后,将fd加入fds集合,每次轮询一遍fds中recv(非阻塞)数据,没有数据则立即返回错误,每次轮询所有fd(包括没有发生读写事件的fd),会造成资源浪费。

2.2代码逻辑

setNonblocking(listen_fd)
// 伪代码描述
while(1) {
  // accept非阻塞(cpu一直忙轮询)
  client_fd = accept(listen_fd)
  if (client_fd != null) {
    // 有人连接
    fds.append(client_fd)
  } else {
    // 无人连接
  }  
  for (fd in fds) {
    // recv非阻塞
    setNonblocking(client_fd)
    // recv 为非阻塞命令
    if (len = recv(fd) && len > 0) {
      // 有读写数据
      // logic
    } else {
       无读写数据
    }
  }  
}

三、IO多路复用机制

1.概念

IO多路复用机制都是IO(读缓冲区和写缓冲区)同步机制,通过内核的监听事件,监视多个文件描述符,一旦某个文件发过来,读缓冲区就会有变化,内核就监听到了,就通知程序对文件读写。selcet函数是一个轮循函数,即当循环询问文件节点,可设置超时时间,超时时间到了就跳过代码继续往下执行。


2.select

2.1概念

select时间复杂度O(n),它仅仅知道有I/O事件发生了,但是不知道具体是哪几个流,所以只能无差别轮询,找到能读出的数据,或者写入数据的流,以便对它们操作。所以当流越多,越需要时间。

2.2函数原型

int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);

参数:

        1.int maxfdp集合中所有文件描述符最大值+1,在windows中这个参数不重要,设置出错也没问题。

        2.struct fd_set 存放文件描述符的集合,即文件句柄。fd_set集合可以通过一些宏由人为来操作。

        宏:

FD_ZERO(fd_set *fdset) 清空fdset与所有文件句柄的联系。
FD_SET(int fd, fd_set *fdset) 建立文件句柄fd与fdset的联系。
FD_CLR(int fd, fd_set *fdset):清除文件句柄fd与fdset的联系。
FD_ISSET(int fd, fdset *fdset):检查fdset联系的文件句柄fd是否可读写,>0表示可读写。 

        3.struct timeval 有3种情况。第一:传参为NULL,即不传入时间结构,表示select阻塞,一定要等到监视文件描述符集合中某个文件描述符发生变化为止。第二:传参为0秒0毫秒,让select变成非阻塞函数,不管文件描述符是否变化,都会返回继续执行,文件无变化返回0,有变化返回正值。第三:timeout的值大于0,这就是等待的超时时间,即select在timeout时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回。

struct timeval{
    long tv_sec; //秒
    long tv_usec; //毫秒

};

        4.三个fd_set分别监视文件描述符的读写异常变化,如果有select会返回一个大于0的值。如果没有则在timeout的时间后select返回0,若发生错误返回负值。可以传入NULL值,表示不关心任何文件的读/写/异常变化。

2.3 select机制

解select模型的关键在于理解fd_set,为说明方便,取fd_set长度为1字节,fd_set中的每一bit可以对应一个文件描述符fd。则1字节长的fd_set最大可以对应8个fd。

(1)执行fd_set set; FD_ZERO(&set);则set用位表示是0000,0000。

(2)若fd=5,执行FD_SET(fd,&set);后set变为0001,0000(第5位置为1)

(3)若再加入fd=2,fd=1,则set变为0001,0011

(4)执行select(6,&set,0,0,0)阻塞等待

(5)若fd=1,fd=2上都发生可读事件,则select返回,此时set变为0000,0011。注意:没有事件发生的fd=5被清空。

所以,我们可以得到select模型的特点:
(1) 文件描述符个数有限,一般来说这个数目和系统内存关系很大。select使用位域的方式来传递关心的文件描述符,位域就有最大长度。select使用位域的方式传回就绪的文件描述符,调用者需要循环遍历每一个位判断是否就绪,当文件描述符个数很多,但是空闲的文件描述符大大多于就绪的文件描述符的时候,效率很低。

(2) 将fd加入select监控集的同时,还要再使用一个数据结构array保存放到select监控集中的fd,一是用于再select 返回后,array作为源数据和fd_set进行FD_ISSET判断。二是select返回后会把以前加入的但并无事件发生的fd清空,则每次开始 select前都要重新从array取得fd逐一加入(FD_ZERO最先),扫描array的同时取得fd最大值maxfd,用于select的第一个 参数。

(3) 可见select模型必须在select前循环array(加fd,取maxfd),select返回后循环array(FD_ISSET判断是否有时间发生)。
 

3.poll

3.1 API

#include <poll.h>
int poll(struct pollfd *fds, nfds_t nfds, int timeout);
功能:监听多个文件描述符的属性变化
参数:
    fds:指向struct pollfd的结构体的第0个值的指针。
    struct pollfd{
        int fd; //套接字
        short events; //等待的事件
        short revents; //实际发生的事件
};
    nfds:指定第一个参数中结构体的个数
    timeout:设定时间限制,超时后不管是否还有文件句柄改变函数都要返回

3.2 优点

1.不像select,只有1024个文件描述符的限制,poll没有文件描述符限制。

2.将输入输出参数进行分离,不用每次设定。

4.epoll

4.1 API

#include <sys/epoll.h>

创建红黑树:
int epoll_create(int size);
    参数:
    size :  监听的文件描述符的上限,  2.6版本之后写1即可,
    返回:  返回树的句柄

上树、下树、修改节点:
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
参数:
    epfd : 树的句柄
    op : EPOLL_CTL_ADD 上树   EPOLL_CTL_DEL 下树 EPOLL_CTL_MOD 修改
    fd : 上树,下树的文件描述符
    event :   上树的节点

   typedef union epoll_data {
               void        *ptr;
               int          fd;
               uint32_t     u32;
               uint64_t     u64;
           } epoll_data_t;


           struct epoll_event {
               uint32_t     events;      /* Epoll events */  需要监听的事件
               epoll_data_t data;        /* User data variable */ 需要监听的文件描述符
           };
事件包括:EPOLLIN、EPOLLOUT、EPOLLRDHUP、EPOLLERR


监听:
int epoll_wait(int epfd, struct epoll_event *events,
                      int maxevents, int timeout);
功能: 监听树上文件描述符的变化
    epfd : 数的句柄
    events : 接收变化的节点的数组的首地址
    maxevents :  数组元素的个数
    timeout : -1 永久监听  大于等于0 限时等待

返回值: 返回的是变化的文件描述符个数



将cfd上树:

int epfd =  epoll_create(1);

struct epoll_event ev;

ev. data.fd = cfd;

ev.events = EPOLLIN;

epoll_ctl(epfd, EPOLL_CTL_ADD,cfd, &ev);

4.2 epoll原理

利用红黑树的方式监听文件描述符的变化。

4.3 epoll两种工作方式

边沿触发和水平触发。

5.select/poll/epoll区别

  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值