I/O 多路复用使用背景梳理

最新推荐文章于 2024-09-05 02:16:24 发布

kph_Hajash

最新推荐文章于 2024-09-05 02:16:24 发布

阅读量189

点赞数

分类专栏：网络通信文章标签： epoll

本文链接：https://blog.csdn.net/chuanglan/article/details/103546153

版权

网络通信专栏收录该内容

14 篇文章 1 订阅

订阅专栏

内容总结自《UNIX 环境高级编程》高级 I/O 部分

1. 问题背景描述

在终端使用 telnet 命令连接到一个 TCP server，假设 server 会返回你在终端输入的内容。

那么现在终端的这个 telnet 进程，会从两个文件描述符读取内容，一个是标准输入，一个是网络连接（server 返回的数据），注意只有一个进程。

打开一个文件时我们可以以阻塞或非阻塞方式打开，假设此时我们使用阻塞的方式打开一个文件，并使用 read 来读取数据，再假设此时 read 阻塞在标准输入的文件描述符上，且标准输入无数据，而网络连接有数据达到时，由于程序此时阻塞在标准输入，因此无法处理到达的网络数据。

如果需要输入源有多个，并且是阻塞的，那么先考虑以多进程（父子进程）的方式实现；每个进程处理一个输入源；虽然看似解决了阻塞的问题，但引出了结束进程的复杂性，比如父进程结束时通知子进程，子进程结束时需要通知父进程。

再尝试以多线程的方式实现；数据从标准输入读取再从网络连接发送出去，不可避免存在数据竞态问题，因此需要做线程同步，又引入了较高的复杂性。

再考虑使用非阻塞的方式实现，并且仅用一个进程；那么当标准输入无数据时，read 会立即返回，因此可以继续判断网络连接是否有数据，如果此时网络连接也没数据，可以立即判断标准输入，但此时会耗费极高的 CPU，因此在所有文件描述符都没有数据的情况下，可以让进程睡眠一段时间进而减少 CPU 消耗，但合适的睡眠时间很难确定。

以上的实现方案都基于同步方式，同步阻塞，同步非阻塞，再来看看异步的方式，即异步 I/O 技术。进程告诉内核（fnctl、ioctl）：当描述符准备好 I/O 时，通过信号来通知进程。

但异步 I/O 的使用也有困难，比如不同系统提供的异步 I/O API 不一致，即可移植性差；异步 I/O 在使用上受限，比如 System V 提供 SIGPOLL 来支持异步 I/O，但只有描述符引用 STREAMS 设备（什么是 STREAMS 设备，有哪些？）时才可用，BSD 提供了 SIGIO 信号，但只有描述符引用终端设备或网络时才可用；另外，一个进程只能使用一个信号来处理异步 I/O，如果多个描述符共用一个信号，那么信号发生时进程无法判断是哪一个描述符准备好了。

由于上述方案的种种缺点，引出了 I/O 多路复用技术（I/O multiplexing）。复用是指在同一个进程（线程）中，处理多路 I/O，多路指多个文件描述符。它的思想是，收集进程感兴趣的全部描述符，然后调用一个函数，当这些描述符中的一个或多个准备好 I/O 时，函数返回并告知进程是哪些描述符准备好了。此时进程只需要去这些准备好的描述符上操作即可。