IO多路复用(阻塞IO，非阻塞IO，select,poll,epoll)

量子学习法

已于 2023-03-24 23:28:36 修改

阅读量201

点赞数

文章标签：网络服务器

于 2023-03-19 12:16:32 首次发布

本文链接：https://blog.csdn.net/myIddddd/article/details/129648357

版权

IO多路复用是一种网络IO方式，通常也就是服务器接受客户端连接和请求的一种数据处理方式 。学习IO多路复用我们首先从传统网络IO开始谈起才能更好的理解多路复用IO。

阻塞IO

阻塞IO，服务器端在接受用户用户请求和读取用户数据都会受到阻塞，也就是我们的accept函数和read函数。

accept函数的阻塞无可厚非。我们来看看read函数阻塞点。IO多路复用也就是从read函数细节进行改进。

可以发现，阻塞点在于数据从网卡到内核缓冲区，再从内核缓冲区到用户缓冲区。因此，若用户一直不发送数据，我们的线程就一直卡在read函数上，这就是阻塞IO。

非阻塞IO

解决阻塞IO的方式，是每次在监听到客户端连接后，我们新创建一个线程去read客户数据。也就是说，此时，监听accept是一个线程，监听到后处理数据的是新创建的一个处理数据线程。伪代码：

while(1) {
  connfd = accept(listenfd);  // 阻塞建立连接
  pthread_create（doWork);  // 创建一个新的线程
}
void doWork() {
  int n = read(connfd, buf);  // 阻塞读数据
  doSomeThing(buf);  // 利用读到的数据做些什么
  close(connfd);     // 关闭连接，循环等待下一个连接
}

这样我们的主线程函数（封装accept的函数）就不会卡在等待用户发送数据上。不过，这不是非阻塞IO ，非阻塞IO也在于我们的操作系统在read函数上进行改进。这个非阻塞IO的read 函数的效果是，如果没有数据到达时（到达网卡并拷贝到了内核缓冲区），立刻返回一个错误值（-1），而不是阻塞地等待。这里值得注意的是：非阻塞的 read，指的是在数据到达前，即数据还未到达网卡，或者到达网卡但还没有拷贝到内核缓冲区之前，这个阶段是非阻塞的。当数据已到达内核缓冲区，此时调用 read 函数仍然是阻塞的，需要等待数据从内核缓冲区拷贝到用户缓冲区，才能返回。这样一个巨大好处就是：处理数据线程不会因为等待客户的数据而收到阻塞，因为我们拿到错误值-1了可以做其他事（这里的其他事就是下面IO多路复用遍历fd这件事）了，这就是所谓的非阻塞。

非阻塞IO的弊端是：每个客户端创建一个处理数据线程，服务器端的线程资源很容易被耗光。

所以我们将每 accept 一个客户端连接后，将这个文件描述符（connfd）放到一个数组里，然后弄一个新的线程去不断遍历这个数组，调用每一个元素的非阻塞 read 方法，若返回-1则继续遍历，否则则处理数据。

（3种多路复用开始！！！！！）