什么是IO多路复用？用来解决什么问题？如何实现？

最新推荐文章于 2023-03-21 17:42:19 发布

Snippers

最新推荐文章于 2023-03-21 17:42:19 发布

阅读量5k

点赞数 7

分类专栏：网络编程文章标签：并发

本文链接：https://blog.csdn.net/Snippers/article/details/113359006

版权

网络编程专栏收录该内容

2 篇文章 0 订阅

订阅专栏

IO多路复用是一种高效的处理多个并发I/O连接的技术，常用于服务器端。它通过一个线程管理多个socket，避免了传统多进程/线程模型的资源消耗。本文以机场空管为比喻，解释了IO多路复用的工作原理，对比了select、poll和epoll的区别，并提供了epoll的使用示例。epoll在性能和可扩展性上优于select和poll，尤其适用于高并发场景。

摘要由CSDN通过智能技术生成

白话IO多路复用

这里引述知乎大佬对于IO多路复用的机场空管的比喻和理解：

假设你是一个机场的空管，你需要管理到你机场的所有的航线，包括进港，出港，有些航班需要放到停机坪等待，有些航班需要去登机口接乘客。你会怎么做?

最简单的做法，就是你去招一大批空管员，然后每人盯一架飞机，从进港，接客，排位，出港，航线监控，直至交接给下一个空港，全程监控。

那么问题就来了：

很快你就发现空管塔里面聚集起来一大票的空管员，交通稍微繁忙一点，新的空管员就已经挤不进来了。
空管员之间需要协调，屋子里面就1, 2个人的时候还好，几十号人以后，基本上就成菜市场了。
空管员经常需要更新一些公用的东西，比如起飞显示屏，比如下一个小时后的出港排期，最后你会很惊奇的发现，每个人的时间最后都花在了抢这些资源上。

解决方法是他们用flight progress strip ，其中每一个块代表一个航班，不同的槽代表不同的状态，然后一个空管员可以管理一组这样的块（一组航班），而他的工作，就是在航班信息有新的更新的时候，把对应的块放到不同的槽子里面。

如果把每一个航线当成一个Sock(I/O 流), 空管当成服务端Sock管理代码的话：

第一种方法就是最传统的多进程并发模型 (每进来一个新的I/O流会分配一个新的进程管理。)

第二种方法就是IO多路复用。

I/O多路复用 (单个线程，通过记录跟踪每个I/O流(sock)的状态，来同时管理多个I/O流 )。在ngnix中会有很多链接进来， epoll会把他们都监视起来，然后像拨开关一样，谁有数据就拨向谁，然后调用相应的代码处理。

注：每个socket就是一个I/O流，服务端只会监听一个端口，每次来了新的请求，都会创建一个新的socket和客户端通信。

IO多路复用用来解决什么问题

当多个客户端与服务器通信时，若服务器阻塞在其中一个客户的read(sockfd1,…)，当另一个客户数据到达sockfd2时，服务器无法及时处理，此时需要用到IO多路复用。即同时监听n个客户，当其中有一个发来消息时就从select的阻塞中返回，然后调用read读取收到消息的sockfd，然后又循环回select阻塞。这样就解决了阻塞在一个消息而无法处理其它的。即用来解决对多个I/O监听时,一个I/O阻塞影响其他I/O的问题。

IO多路复用如何实现

select, poll, epoll 都是I/O多路复用的具体的实现

select特点：

单个进程所打开的FD是有限制的，通过FD_SETSIZE设置，默认1024。
每次调用select，都需要把fd集合从用户态拷贝到内核态，这个开销在fd很多时会很大。
对socket扫描时是线性扫描，采用轮询的方法，效率较低（高并发时）。
select 不是线程安全的。

poll特点：

poll和select是非常相似的，poll相对于select的优化仅仅在于解决了文件描述符不能超过1024个的限制。
select和poll都会随着监控的文件描述符增加而出现性能下降，因此不适合高并发场景。

epoll 特点：

epoll 修复了poll 和select绝大部分问题, 比如：

epoll 现在是线程安全的。
epoll 现在不仅告诉你sock组里面数据，还会告诉你具体哪个sock有数据，你不用自己去找了。
不过缺点是epoll只能工作在linux下

epoll应用在Redis和Nginx中

epoll函数接口与使用示例：

#include <sys/epoll.h>

// 数据结构
// 每一个epoll对象都有一个独立的eventpoll结构体
// 用于存放通过epoll_ctl方法向epoll对象中添加进来的事件
// epoll_wait检查是否有事件发生时，只需要检查eventpoll对象中的rdlist双链表中是否有epitem元素即可
struct eventpoll {
    /*红黑树的根节点，这颗树中存储着所有添加到epoll中的需要监控的事件*/
    struct rb_root  rbr;
    /*双链表中则存放着将要通过epoll_wait返回给用户的满足条件的事件*/
    struct list_head rdlist;
};

// API

int epoll_create(int size); // 内核中间加一个 ep 对象，把所有需要监听的 socket 都放到 ep 对象中
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event); // epoll_ctl 负责把 socket 增加、删除到内核红黑树
int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);// epoll_wait 负责检测可读队列，没有可读 socket 则阻塞进程

int main(int argc, char* argv[])
{
   /*
   * 在这里进行一些初始化的操作，
   * 比如初始化数据和socket等。
   */

    // 内核中创建ep对象
    epfd=epoll_create(256);
    // 需要监听的socket放到ep中
    epoll_ctl(epfd,EPOLL_CTL_ADD,listenfd,&ev);
 
    while(1) {
      // 阻塞获取
      nfds = epoll_wait(epfd,events,20,0);
      for(i=0;i<nfds;++i) {
          if(events[i].data.fd==listenfd) {
              // 这里处理accept事件
              connfd = accept(listenfd);
              // 接收新连接写到内核对象中
              epoll_ctl(epfd,EPOLL_CTL_ADD,connfd,&ev);
          } else if (events[i].events&EPOLLIN) {
              // 这里处理read事件
              read(sockfd, BUF, MAXLINE);
              //读完后准备写
              epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev);
          } else if(events[i].events&EPOLLOUT) {
              // 这里处理write事件
              write(sockfd, BUF, n);
              //写完后准备读
              epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev);
          }
      }
    }
    return 0;
}

select/poll/epoll之间的区别

	select	poll	epoll
数据结构	bitmap	数组	红黑树
最大连接数	1024	无上限	无上限
fd拷贝	每次调用select拷贝	每次调用poll拷贝	fd首次调用epoll_ctl拷贝，每次调用epoll_wait不拷贝
工作效率	轮询：O(n)	轮询：O(n)	回调：O(1)