五种IO模型比较

参考:《UNIX 网络编程 · 卷1 : 套接字联网API》

五种I/O模型

在 Unix 下可用的 5 种 I/O 模型:阻塞式IO、非阻塞式IO、IO复用、信号驱动IO、异步IO。

一个输入操作通常包括两个不同的阶段:

  1. 等待数据准备好
  2. 从内核向进程复制数据

阻塞式IO

最流行的 IO 模型是阻塞式 IO 模型如下:
阻塞式IO模型

在该图中,进程调用 recvfrom,其系统调用直到数据报到达且被复制到应用进程的缓冲区中或者发生错误才返回。最常见的错误是系统调用被信号中断。我们说进程从调用 recvfrom 开始到他返回的整段时间内是被阻塞的。recvfrom 成功返回后,进程开始处理数据报。

非阻塞式IO

进程把一个套接字设置成非阻塞是在通知内核:当所请求的 IO 操作非得把本进程投入睡眠才能完成时,不要把本进程投入睡眠,而是返回一个错误。非阻塞式 IO 模型模型如下:
非阻塞式IO模型
前三次调用 recvfrom 时没有数据可返回,因此内核转而立即返回一个 EWOULDBLOCK 错误。第四次调用 recvfrom 时已经有一个数据准备好,它被复制到应用进程缓冲区,于是 recvfrom 成功返回。

当一个进程像这样对一个非阻塞式描述符循环调用 recvfrom 时,称之为轮询。应用进程保持轮询内核,以查看某个操作是否就绪,往往消费大量 CPU 时间,用处不是很多。

IO复用模型

我们可以使用 IO 多路复用,阻塞在 select 或者 epoll 之上,而不是阻塞在真正的 IO 系统上,IO 多路复用模型如下:
IO复用模型

阻塞于 select 调用,等待数据报套接字变为可读。当 select 返回套接字可读这一条件时,调用 recvfrom 把所读数据报复制到进程缓冲区。

但是事实上 IO 复用使用 select 使用了两个系统调用而不是单个,看起来 IO 复用还稍有劣势。但是优势在于可以等待多个描述符的就绪。

信号驱动式IO模型

我们也可以用信号,让内核在描述符就绪时发送 SIGIO 信号通知我们。信号驱动式 IO 模型如下:
信号驱动式IO模型
首先需要开启套接字的信号驱动式 IO 功能,并通过 sigaction 系统调用安装一个信号处理函数。该系统调用将立即返回,我们的进程继续工作,也就是它没有阻塞。当数据报准备好读取时,内核就为该进程产生一个 SIGIO 信号。随后既可以在信号处理函数中调用 recvfrom 读取到数据报,并通知主循环数据已经准备好待处理,也可以通知主循环,让它继续读取数据报。

无论如何处理 SIGIO 信号,这种模型的优势在于等待数据报到达期间进程不能被阻塞。主循环可以继续执行,只要等待来自信号处理函数的通知:既可以是数据已准备好被处理,也可以是数据报已准备好被读取。

异步IO模型

异步 IO 由 POSIX 规范定义,这些函数的工作机制是:告知内核自动某个操作,并让内核在整个操作完成后通知我们。与信号驱动式IP的区别为:信号驱动式 IO 是由内核通知我们可以启动一个 IO 操作,而异步 IO 模型是由内核通知我们 IO 操作何时完成。

异步IO模型

调用 aio_read 函数和文件偏移,并告诉内核当整个操作完成时如何通知我们。该系统调用立即返回,而且在等待 IO 完成期间,进程不被阻塞。

五种IO模型比较

可以看到前 4 种模型的主要区别在于第一阶段,因为它们的第二阶段是一样的:在数据从内核复制到用户进程的缓冲区期间,进程阻塞与 recvfrom 调用,相反异步 IO 模型在这两个阶段都要处理,从而不同于其他 4 种模型。
几种IO模型比较
POSIX 把同步 IO 和异步 IO 定义如下:

  • 同步 IO 操作导致请求进程阻塞,直到 IO 操作完成。
  • 异步 IO 操作不导致进程阻塞。

所以前四种 IO 模型都是同步式 IO 模型,只有异步 IO 模型与 POSIX 定义的异步 IO 相匹配。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值