转载：精讲五种I/O 模式，你了解几种？

最新推荐文章于 2022-05-30 00:27:09 发布

黄道婆

最新推荐文章于 2022-05-30 00:27:09 发布

阅读量282

点赞数

分类专栏： # 网络文章标签： udp

原文链接：https://zhuanlan.zhihu.com/p/210703940

版权

网络专栏收录该内容

4 篇文章 0 订阅

订阅专栏

原始链接：精讲五种I/O 模式，你了解几种？ - 知乎公众号【Linux开发架构之路】个人gitee: 零声社区下面我们简单的介绍一个各种I/O 操作模式。在Linux/UNIX 下，有下面这五种I/O 操作方式： Ÿ 阻塞I/O Ÿ 非阻塞I/O Ÿ I/O 多路复用 Ÿ 信号驱动I/O（SIGIO） Ÿ…https://zhuanlan.zhihu.com/p/210703940

精讲五种I/O 模式，你了解几种？

后端开发老鸽

IT程序员

关注他

公众号【Linux开发架构之路】

个人gitee:

零声社区gitee.com/zero-sound-community正在上传…重新上传取消

下面我们简单的介绍一个各种I/O 操作模式。在Linux/UNIX 下，有下面这五种I/O 操作方式：

Ÿ 阻塞I/O

Ÿ 非阻塞I/O

Ÿ I/O 多路复用

Ÿ 信号驱动I/O（SIGIO）

Ÿ 异步I/O

这章讲述了一些I/O 的细节，你可以在第一次阅读的时候跳过这部分，然后在第二次阅读本书的时候再来读这一节。

一般来说，程序进行输入操作有两步：

1. 等待有数据可以读

2. 将数据从系统内核中拷贝到程序的数据区。

对于一个对套接字的输入操作，第一步一般来说是等待数据从网络上传到本地。当数据包到达的时候，数据将会从网络层拷贝到内核的缓存中；第二步是从内核中把数据拷贝到程序的数据区中。

6.1.1 阻塞I/O 模式

阻塞I/O 模式是最普遍使用的I/O 模式。大部分程序使用的都是阻塞模式的I/O 。缺省的，一个套接字建立后所处于的模式就是阻塞I/O 模式。

对于一个UDP 套接字来说，数据就绪的标志比较简单：

Ÿ 已经收到了一整个数据报

Ÿ 没有收到。

而TCP 这个概念就比较复杂，需要附加一些其他的变量。

在图6-4 中，一个进程调用recvfrom ，然后系统调用并不返回知道有数据报到达本地系统，然后系统将数据拷贝到进程的缓存中。（如果系统调用收到一个中断信号，则它的调用会被中断）我们称这个进程在调用recvfrom 一直到从recvfrom 返回这段时间是阻塞的。当recvfrom正常返回时，我们的进程继续它的操作。

图 6-4 tcp 连接的简单示例

6.1.1 I/O 多路复用

在使用I/O 多路技术的时候，我们调用select()函数和poll()函数，在调用它们的时候阻塞，而不是我们来调用recvfrom（或recv）的时候阻塞。图6-6 说明了它的工作方式。

当我们调用select 函数阻塞的时候，select 函数等待数据报套接字进入读就绪状态。当select 函数返回的时候，也就是套接字可以读取数据的时候。这时候我们就可以调用recvfrom 函数来将数据拷贝到我们的程序缓冲区中。

和阻塞模式相比较，select()和poll()并没有什么高级的地方，而且，在阻塞模式下只需

要调用一个函数：读取或发送，在使用了多路复用技术后，我们需要调用两个函数了：先调用select()函数或poll()函数，然后才能进行真正的读写。

多路复用的高级之处在于，它能同时等待多个文件描述符，而这些文件描述符（套接字描述符）其中的任意一个进入读就绪状态，select()函数就可以返回。

图 6-6 I/O 多路复用

假设我们运行一个网络客户端程序，要同时处理套接字传来的网络数据又要处理本地的标准输入输出。在我们的程序处于阻塞状态等待标准输入的数据的时候，假如服务器端的程序被kill（或是自己Down 掉了），那么服务器程端的TCP 协议会给客户端（我们这端）的 TCP 协议发送一个FIN 数据代表终止连接。但是我们的程序阻塞在等待标准输入的数据上，在它读取套接字数据之前（也许是很长一段时间），它不会看见结束标志．我们就不能够使用阻塞模式的套接字。

IO 多路技术一般在下面这些情况中被使用：

Ÿ 当一个客户端需要同时处理多个文件描述符的输入输出操作的时候（一般来说是标准的输入输出和网络套接字），I/O 多路复用技术将会有机会得到使用。

Ÿ 当程序需要同时进行多个套接字的操作的时候。

Ÿ 如果一个TCP 服务器程序同时处理正在侦听网络连接的套接字和已经连接好的套接字。

Ÿ 如果一个服务器程序同时使用TCP 和UDP 协议。

Ÿ 如果一个服务器同时使用多种服务并且每种服务可能使用不同的协议（比如inetd

就是这样的）。

I/O 多路服用技术并不只局限与网络程序应用上。几乎所有的程序都可以找到应用I/O

多路复用的地方。

6.1.1 信号驱动I/O 模式

我们可以使用信号，让内核在文件描述符就绪的时候使用SIGIO 信号来通知我们。我们将这种模式称为信号驱动I/O 模式。
使用这种模式，我们首先需要允许套接字使用信号驱动I/O ，还要安装一个SIGIO 的处理函数。在这种模式下，系统调用将会立即返回，然后我们的程序可以继续做其他的事情。当数据就绪的时候，系统会向我们的进程发送一个SIGIO 信号。这样我们就可以在SIGIO 信号的处理函数中进行I/O 操作（或是我们在函数中通知主函数有数据可读）。

我们现在还不必对SIGIO信号处理函数做过多的了解（在下一章中我们会介绍信号的有关内容）。对于信号驱动I/O模式，它的先进之处在于它在等待数据的时候不会阻塞，程序可以做自己的事情。当有数据到达的时候，系统内核会向程序发送一个SIGIO信号进行通知，这样我们的程序就可以获得更大的灵活性，因为我们不必为等待数据进行额外的编码。

图 6-7 信号驱动 I/O

信号I/O 可以使内核在某个文件描述符发生改变的时候发信号通知我们的程序。异步I/O 可以提高我们程序进行I/O 读写的效率。通过使用它，当我们的程序进行I/O 操作的时候，内核可以在初始化I/O 操作后立即返回，在进行I/O 操作的同时，我们的程序可以做自己的事情，直到I/O 操作结束，系统内核给我们的程序发消息通知。
基于Berkeley 接口的Socket 信号驱动I/O 使用信号SIGIO。有的系统SIGPOLL 信号，它也是相当于SIGIO 的。
为了在一个套接字上使用信号驱动I/O 操作，下面这三步是所必须的。
（1）一个和SIGIO 信号的处理函数必须设定。
（2）套接字的拥有者必须被设定。一般来说是使用fcntl 函数的F_SETOWN 参数来进行设定拥有者。
（3）套接字必须被允许使用异步I/O。一般是通过调用fcntl 函数的F_SETFL 命令，
O_ASYNC 为参数来实现。
注意：我们在设置套接字的属主之前必须将SIGIO 的信号处理函数设好，SIGIO 的缺省动作是被忽略。因此我们如果以相反的顺序调用这两个函数调用，那么在fcntl 函数调用之后，signal 函数调用之前就有一小段时间程序可能接收到SIGIO 信号。那样的话，信号将会被丢弃。在SVR4 系统中，SIGIO 在<sys/signal.h> 头文件中被定义为SIGPOLL，而SIGPOLL 信号的缺省动作是终止这个进程。所以我们一定要保证这两个函数的调用顺序：先调用signal 设置好SIGIO 信号处理函数，然后在使用fcntl 函数设置套接字的属主。

虽然设定套接字为异步I/O 非常简单，但是使用起来困难的部分是怎样在程序中断定

产生SIGIO 信号发送给套接字属主的时候，程序处在什么状态。

1. UDP 套接字的SIGIO 信号

在UDP 协议上使用异步I/O 非常简单．这个信号将会在这个时候产生：

Ÿ 套接字收到了一个数据报的数据包。

Ÿ 套接字发生了异步错误。

当我们在使用UDP 套接字异步I/O 的时候，我们使用recvfrom()函数来读取数据报数据或是异步I/O 错误信息。

2. TCP 套接字的SIGIO 信号

不幸的是，异步I/O 几乎对TCP 套接字而言没有什么作用。因为对于一个TCP 套接字来说，SIGIO 信号发生的几率太高了，所以SIGIO 信号并不能告诉我们究竟发生了什么事情。在TCP 连接中，SIGIO 信号将会在这个时候产生：

Ÿ 在一个监听某个端口的套接字上成功的建立了一个新连接。

Ÿ 一个断线的请求被成功的初始化。

Ÿ 一个断线的请求成功的结束。

Ÿ 套接字的某一个通道（发送通道或是接收通道）被关闭。

Ÿ 套接字接收到新数据。

Ÿ 套接字将数据发送出去。

Ÿ 发生了一个异步I/O 的错误。

举例来说，如果一个正在进行读写操作的TCP 套接字处于信号驱动I/O 状态下，那么每当新数据到达本地的时候，将会产生一个SIGIO 信号，每当本地套接字发出的数据被远程确认后，也会产生一个SIGIO 信号。对于我们的程序来讲，是无法区分这两个SIGIO 有什么区别的。在这种情况下使用SIGIO，TCP 套接字应当被设置为无阻塞模式来阻止一个阻塞的read 和write（recv 和send）操作。我们可以考虑在一个只进行监听网络连接操作的套接字上使用异步I/O，这样当有一个新的连接的时候，SIGIO 信号将会产生。

一个对信号驱动I/O 比较实用的方面是NTP（网络时间协议Network Time Protocol）服务器，它使用UDP。这个服务器的主循环用来接收从客户端发送过来的数据报数据包，然后再发送请求。对于这个服务器来说，记录下收到每一个数据包的具体时间是很重要的。因为那将是返回给客户端的值，客户端要使用这个数据来计算数据报在网络上来回所花费的时间。图6-8 表示了怎样建立这样的一个UDP 服务器。

图 6-8 NTP 服务器

大多数的UDP 服务都被设计成图左边的模式。但是NTP 服务器使用的是图右边的技术。当有一个新的数据报到达的时候，SIGIO 的处理函数会取出它放入一个程序等待读取的队列，主程序会从这个队列中读取数据。虽然这样会增加程序代码的长度，但是它能够获取数据包到达服务器程序的准确时间．

6.1.1 异步I/O 模式

当我们运行在异步I/O 模式下时，我们如果想进行I/O 操作，只需要告诉内核我们要进行I/O 操作，然后内核会马上返回。具体的I/O 和数据的拷贝全部由内核来完成，我们的程序可以继续向下执行。当内核完成所有的I/O 操作和数据拷贝后，内核将通知我们的程序。

异步I/O 和信号驱动I/O 的区别是：

Ÿ 信号驱动I/O 模式下，内核在操作可以被操作的时候通知给我们的应用程序发送

SIGIO 消息。

Ÿ 异步I/O 模式下，内核在所有的操作都已经被内核操作结束之后才会通知我们的应用程序。

如下图，当我们进行一个IO 操作的时候，我们传递给内核我们的文件描述符，我们

的缓存区指针和缓存区的大小，一个偏移量offset，以及在内核结束所有操作后和我们联系的方法。这种调用也是立即返回的，我们的程序不需要阻塞住来等待数据的就绪。我们可以要求系统内核在所有的操作结束后（包括从网络上读取信息，然后拷贝到我们提供给内核的缓存区中）给我们发一个消息。

图 6-9 异步 I/O

6.1.1 几种I/O 模式的比较

下面这个表格对这几种I/O 模式进行了对比

编辑于 2020-09-01

黄道婆

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
转载：精讲五种I/O 模式，你了解几种？

原始链接：精讲五种I/O 模式，你了解几种？ - 知乎公众号【Linux开发架构之路】个人gitee: 零声社区下面我们简单的介绍一个各种I/O 操作模式。在Linux/UNIX 下，有下面这五种I/O 操作方式： Ÿ 阻塞I/O Ÿ 非阻塞I/O Ÿ I/O 多路复用 Ÿ 信号驱动I/O（SIGIO） Ÿ…https://zhuanlan.zhihu.com/p/210703940精讲五种I/O 模式，你了解几种？后端开发老鸽IT程序员关注他公众号【Linux开发架构之路
复制链接

扫一扫