Linux中的五种I/O模型

最新推荐文章于 2023-04-03 17:25:15 发布

喜欢恋着风

最新推荐文章于 2023-04-03 17:25:15 发布

阅读量688

点赞数 1

分类专栏： linux 服务器编程

本文链接：https://blog.csdn.net/u010150046/article/details/76888752

版权

linux 同时被 2 个专栏收录

20 篇文章 4 订阅

订阅专栏

服务器编程

14 篇文章 0 订阅

订阅专栏

概念说明

用户空间和内核空间

现在操作系统都是采用虚拟存储器，那么对32位操作系统而言，它的寻址空间（虚拟存储空间）为4G（2的32次方）。操作系统的核心是内核，独立于普通的应用程序，可以访问受保护的内存空间，也有访问底层硬件设备的所有权限。为了保证用户进程不能直接操作内核（kernel），保证内核的安全，操作系统将虚拟空间划分为两部分，一部分是内核空间，一部分是用户空间。

针对Linux OS而言，将最高的1G字节（虚拟地址0XC0000000~0XFFFFFFFF），供内核使用，称为内核空间，而将较低的3G字节（0X00000000~0XBFFFFFFF），供各个进程使用，称为用户空间；

进程切换

为了控制进程的执行，内核必须有能力挂起正在CPU上运行的进程，并恢复以前挂起的某个进程的运行，这种行为称为进程的切换。因此可以说，任何进程都是在OS内核的支持下运行的，是与内核紧密相关的；

从一个进程的运行转到另一个进程的运行，这个过程中经过下面的这些变化：

保存处理机上下文，包括程序计数器和其他寄存器；
更新PCB信息；
把进程的PCB移到相应的队列，如就绪、在某事件阻塞等队列；
选择另一个进程执行，并更新其PCB；
更新内存管理的数据结构；
恢复处理机上下文；

总而言之就是很耗资源，详细参考：进程切换

进程的阻塞

正在执行的进程，由于期待的某些事件未发生，如请求系统资源失败、等待某种操作完成、新数据尚未到达或无新工作做等，则由系统自动执行阻塞原语（Block），使自己由运行状态变为阻塞状态。可见，进程的阻塞是进程自身的一种主动行为，也因此只有运行态的进程（获得CPU）才可能转为阻塞状态。当进程进入阻塞状态时，是不占用CPU资源的。

文件描述符fd

文件描述符（File descriptor）是计算机科学中的一个术语，是一个用于表述指向文件的引用的抽象化概念；

文件描述符形式上是一个非负整数，实际上，它是一个索引值，指向内核为每一个进程所维护的该进程打开文件的记录表。当程序打开一个现有文件或创建一个新文件时，内核向进程返回一个文件描述符。在程序设计中，一些涉及底层的程序编写往往会围绕着文件描述符展开。但是文件描述符这一概念往往只适用于UNIX、Linux这样的操作系统。

Linux中的文件描述符与打开文件之间的关系

缓存IO

缓存IO又称作标准IO，大多数文件系统的默认IO操作都是缓存IO，在Linux的缓存IO机制中，操作系统会将IO的数据缓存在文件系统的页缓存（page cache）中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间；

缓存IO的缺点：数据在传输过程中需要在应用程序地址空间和内核进行多次的数据拷贝操作，这些数据拷贝操作所带来的CPU以及内存开销是非常大的。

Linux IO模型

网络IO的本质是socket的读取，socket在Linux OS中被抽象为流，IO可以理解为对流的操作，对于一次IO访问，数据会先被拷贝到操作系统内核缓冲区，然后从内核缓冲区拷贝到应用程序的地址空间，所以当一个read操作发生时，会经历两个阶段：

等待数据准备；
将数据从内核拷贝到进程中；

对socket流而言：

通常涉及等待网络上的数据分组到达，然后被复制到内核的某个缓冲区；
把数据从内核缓冲区复制到应用进程缓冲区；

网络应用需要处理的无非就是两大类问题：网络IO、数据计算。相对于后者，网络IO的延迟，给应用带来的性能瓶颈大于后者。网络IO的模型大致有如下几种：

异步IO
同步模型
- 阻塞IO
- 非阻塞IO
- 多路复用IO
- 信号驱动IO

从同步异步，阻塞非阻塞的维度划分来看：

这里写图片描述

每个 IO 模型都有自己的使用模式，它们对于特定的应用程序都有自己的优点。本节将简要对其一一进行介绍。常见的IO模型有阻塞、非阻塞、IO多路复用，异步。以一个生动形象的例子来说明这四个概念。

周末我和女友去逛街，中午饿了，我们准备去吃饭。周末人多，吃饭需要排队，我和女友有以下几种方案。

同步阻塞IO（blocking IO）

场景描述：

我和女友点完餐后，不知道什么时候能做好，只好坐在餐厅里面等，直到做好，然后吃完才离开。女友本想还和我一起逛街的，但是不知道饭能什么时候做好，只好和我一起在餐厅等，而不能去逛街，直到吃完饭才能去逛街，中间等待做饭的时间浪费掉了。这就是典型的阻塞。

网络模型：

同步阻塞IO模型是最常用的一个模型，也是最简单的模型。在Linux中，默认情况下所有socket都是blocking。其符合人们最常见的思考逻辑，阻塞就是进程“被”休息，CPU处理其他进程去了。

在这个IO模型中，用户空间的应用程序执行一个系统调用（recvfrom），导致应用程序阻塞，什么也不干，直到数据准备好，并且将数据从内核复制到用户进程，最后进程处理数据，在等待数据到处理数据的两个阶段，整个进程被阻塞，不能处理别的网络IO，调用应用程序处于一种不再消费 CPU 而只是简单等待响应的状态，因此从处理的角度来看，这是非常有效的。在调用recv()/recvfrom()函数时，发生在内核中等待数据和复制数据的过程，大致如下图：

这里写图片描述

流程描述：

当用户进程调用了recv()/recvfrom()这个系统调用：

Kernel就开始了IO的第一阶段：准备数据（对于网络IO来说，很多时候数据在一开始没有到达，比如，还没有收到一个完整的UDP包，这个时候Kernel就要等待足够的数据到来）。这个过程需要等待，也就是说数据被拷贝到OS内核的缓冲区是需要一个过程的。而在用户进程这边，整个进程会被阻塞（当然，是进程自己选择阻塞）。

第二个阶段：当Kernel一直等到数据准备好了，它就会将数据从Kernel中拷贝到用户内存，然后Kernel返回结果，用户进程才解除block的状态，重新运行起来；

所以，同步阻塞（blocking IO）的特点就是在IO执行的两个阶段都被block了；

优点：

能够及时返回数据，无延迟；
对内核开发者来说省事；

缺点：

对用户来说处于等待就要付出性能的代价；

同步非阻塞IO（nonblocking IO）

场景描述：

我女友不甘心白白在这等，又想去逛商场，又担心饭好了。所以我们逛一会，回来询问服务员饭好了没有，来来回回好多次，饭都还没吃都快累死了啦。这就是非阻塞。需要不断的询问，是否准备好了。

网络模型：

同步非阻塞就是“每隔一会瞄一眼进度条”的轮行（polling）方式，在这种模型中，设备是以非阻塞的形式打开的，意味着IO操作不会立即完成，read操作可能会返回一个错误代码，说明这个命令不能立即满足（EAGAIN 或 EWOULDBLOCK）。

在网络IO的时候，非阻塞IO也会进行recvfrom系统调用，检查数据是否准备好，与阻塞IO不一样，“非阻塞将大的正片时间阻塞分成N多的小的阻塞，所以进程不断的有机会“被”CPU光顾”；

也就是说非阻塞的recvfrom系统调用之后，进程并没有被阻塞，内核马上返回给进程，如果数据还没有准备好，此时会返回一个error。进程在返回之后，可以干点别的事，然后再发起recvfrom系统调用。重复上面的过程，循环往复的进行recvfrom系统调用。这个过程通常被称为轮询。轮询检查内核数据，直到数据准备好，再拷贝数据到进程，进行数据处理，需要注意，拷贝数据整个过程，进程仍处于阻塞的状态。

在Linux下，可以通过设置socket使其变为non-blocking，当对一个non-blocking socket执行读操作的时候，流程如图所示：

这里写图片描述

流程描述：

当用户进程发出read操作时，如果kernel 中的数据没有准备好，那么他并不会block用户进程，而是立即返回一个error，从用户进程角度将，它发起一个read操作后，并不需要等待，而是马上得到一个结果，用户进程判断结果是一个error时，他就知道数据还没有准备好，于是它可以再次发送read操作。一旦kernel 中的数据准备好了，并且再次收到了用户进程的system call，那么它马上就将数据拷贝到用户内存，然后返回。

non-blocking IO的特点是用户进程需要不断的主动询问Kernel数据准备好了没有。

同步非阻塞相比同步阻塞方式：

优点：能够在等待完成时间里干其他活了（包括提交其他任务，也就是“后台”可以有多个任务同时执行）；
任务完成的响应延迟增大了，因为每过一段时间才去轮询一次read操作，而任务可能在两次轮询之间的任意时间完成，这会导致整体数据吞吐量的降低；

IO多路复用（IO multiplexing）

场景描述：

与第二个方案差不多，餐厅安装了电子屏幕用来显示点餐的状态，这样我和女友逛街一会，回来就不用去询问服务员了，直接看电子屏幕就可以了。这样每个人的餐是否好了，都直接看电子屏幕就可以了，这就是典型的IO多路复用。

网络模型：

同步非阻塞方式下需要不断主动查询，查询占据了很大一部分过程，轮询会消耗大量的CPU时间，而“后台”可能有多个任务同时进行，人们就想到了循环查询多个任务的完成状态，只要有任何一个任务完成，就去处理它。如果轮询不是进程的用户态，而是有人帮忙就好了，那么这就是所谓的“IO多路复用”。UNIX/Linux下的select、pool、epoll就是干这个的（epoll比poll、select效率高，但是做的事是一样的）。

IO多路复用有几个特别的系统调用select、poll、epoll函数，select调用是内核级别的，select轮询相对于非阻塞的轮询的区别在于前者可以等待多个socket，能实现同时对多个IO端口进行监听，当其中任何一个socket的数据准备好了，就能返回进行可读，然后进程再进行recvfrom系统调用，将数据由内核拷贝到用户进程，当然这个过程是阻塞的。

select或poll调用之后，会阻塞进程，与同步阻塞（blocking IO）不同的是，此时的select不是等到socket数据全部到达再处理，而是有一部分数据就会调用用户进程来处理，如何知道有一部分数据到达了呢？监视的事情交给了内核，内核负责数据到达的处理，也可以理解为“非阻塞”吧。

IO复用模型会用到select、poll、epoll函数，这几个函数也会使用进程阻塞，但是和阻塞IO所不同的是，这几个函数可以同时阻塞多个IO操作，而且可以同时对多个读操作，多个写操作的I/O函数进行检测，知道有数据可读或可写时（注意不是全部数据可读或可写），才真正调用I/O操作函数。

对于多路复用，也就是轮询多个socket，多路复用既然可以处理多个IO，也就带来了新的问题，多个IO之间的顺序变得不确定了，当然也可以针对不同的编号。具体流程，如下图所示：

这里写图片描述

流程描述：

IO multiplexing就是我们说的select、poll、epoll，有些地方称这些IO方式为event driven IO，select/poll好处就是单个process就可以同时处理多个网络连接的IO。它的基本原理就是select、poll、epoll这些函数会不断的轮询所负责的所有socket，当某个socket有数据到达了，就通知用户进程。

当用户进程调用了select，那么整个进程会被block，而同时，kernel会“监视”所有select负责的socket，当任何一个socket中的数据准备好了，select就会返回。这个时候用户进程再调用read操作，将数据从kernel拷贝到用户进程。

多路复用的特点是通过一种机制一个进程能同时等待IO文件描述符，内核监视这些文件描述符（套接字描述符），其中的任意一个进入读就绪状态，select， poll，epoll函数就可以返回。

对于监视的方式，又可以分为 select， poll， epoll三种方式。

上面的图和blocking IO的图其实并没有太大的不同，事实上，还更差一些。因为这里需要使用两个system call（select和recvfrom），而blocking IO只调用一个system call（recvfrom），但是，用select的优势在于它可以同时处理多个connection。

如果处理的连接数不是很高的话，使用select/epoll的web server不一定被使用multi-threading + blocking IO 的web server性能更好，可能延迟还很大。（select/epoll的优势不在于对于单个连接能够处理的更快，而是在于能处理更多的连接）。

在IO multiplexing Model中，实际中，对于每一个socket，一般都设置成为non-blocking，但是，如上图所示，整个用户的process 其实一直被block，只不过process 是被select这个函数block，而不是被socket IO给block。所以，IO多路复用是阻塞在select，epoll这样的系统调用上，而没有阻塞在真正的I/O系统调用如recvfrom上。

在IO编程过程中，当需要同时处理多个客户端接入请求时，可以利用多线程或I/O多路复用技术进行处理。I/O多路复用技术通过把多个I/O阻塞复用到同一个select的阻塞上，从而使得系统在单线程的情况下可以同时处理多个客户端的请求，与传统的多线程/多进程模型比，I/O多路复用的最大优势就是系统开销小，系统不需要创建新的额外进程或线程，也不需要维护这些进程和线程的运行，降低了系统的维护工作量，节省了系统资源，I/O多路复用的主要应用场景如下：

服务器需要同时处理多个处于监听状态或者多个连接状态的套接字；
服务器需要同时处理多种网络协议的套接字；

了解了前面三种IO模式，在用户进程进行系统调用的时候，他们在等待数据到来的时候，处理的方式不一样，直接等待，轮询，select或poll轮询，两个阶段过程：

第一个阶段有的阻塞，有的不阻塞，有的可以阻塞又可以不阻塞；
第二个阶段都是阻塞的；

从整个IO过程来看，它们都是顺序执行的，因此可归为同步模型（synchronous），都是进程主动等待且向内核检查状态。

高并发的程序一般使用同步非阻塞方式而非多线程 + 同步阻塞方式。要理解这一点，首先要扯到并发和并行的区别。比如去某部门办事需要依次去几个窗口，办事大厅里的人数就是并发数，而窗口个数就是并行度。也就是说并发数是指同时进行的任务数（如同时服务的 HTTP 请求），而并行数是可以同时工作的物理资源数量（如 CPU 核数）。通过合理调度任务的不同阶段，并发数可以远远大于并行度，这就是区区几个 CPU 可以支持上万个用户并发请求的奥秘。在这种高并发的情况下，为每个任务（用户请求）创建一个进程或线程的开销非常大。而同步非阻塞方式可以把多个 IO 请求丢到后台去，这就可以在一个进程里服务大量的并发 IO 请求。

IO多路复用是同步阻塞模型还是异步阻塞模型，在此给大家分析下：

此处仍然不太清楚的，强烈建议大家在细究《聊聊同步、异步、阻塞与非阻塞》中讲同步与异步的根本性区别，同步是需要主动等待消息通知，而异步则是被动接收消息通知，通过回调、通知、状态等方式来被动获取消息。IO多路复用在阻塞到select阶段时，用户进程是主动等待并调用select函数获取数据就绪状态消息，并且其进程状态为阻塞。所以，把IO多路复用归为同步阻塞模式。

信号驱动式IO（signal-driven IO）

信号驱动式IO：首先允许socket进行信号驱动IO，并安装一个信号处理函数，进程继续运行并不阻塞。当数据准备好时，进程会受到SIGIO信号，可以在信号处理函数中调用I/O操作函数处理数据。如图所示：

这里写图片描述

异步非阻塞 IO（asynchronous IO）

场景描述：

女友不想逛街，又餐厅太吵了，回家好好休息一下。于是我们叫外卖，打个电话点餐，然后我和女友可以在家好好休息一下，饭好了送货员送到家里来。这就是典型的异步，只需要打个电话说一下，然后可以做自己的事情，饭好了就送来了。

网络模型：

相对于同步IO，异步IO不是顺序执行，用户进程进行aio_read系统调用之后，无论内核数据是否准备好，都会直接返回给用户进程，然后用户态进程就可以去做别的事情了。等到socket数据准备好了，内核直接复制数据给进程，然后从内核向进程发送通知。IO两个阶段，都是非阻塞的。

Linux提供了AIO库函数实现异步，但是用的很少，目前有很多开源的异步IO库，例如libevent、libev、libuv。异步过程如下图所示：

这里写图片描述

流程描述：

用户进程发起aio_read操作之后，立刻就可以开始做其他事。而另一方面，从Kernel的角度，当它收到一个asynchronous read之后，首先它会立刻返回，所以不会对用户进程产生任何block，然后kernel 会等待数据准备完成，然后将数据拷贝到用户内存，当这一切都完成之后，Kernel会给用户进程发送一个signal或执行一个基于线程的回调函数来完成这次IO处理过程，告诉它read操作完成了。

在Linux中，通知的方式是“信号”：

如果这个进程正在用户态忙着做别的事（例如在计算两个矩阵的乘积），那就强行打断之，调用事先注册的信号处理函数，这个函数可以决定何时以及如何处理这个异步任务。由于信号处理函数是突然闯进来的，因此跟中断处理程序一样，有很多事情是不能做的，因此保险起见，一般是把事件 “登记” 一下放进队列，然后返回该进程原来在做的事。
如果这个进程正在内核态忙着做别的事，例如以同步阻塞方式读写磁盘，那就只好把这个通知挂起来了，等到内核态的事情忙完了，快要回到用户态的时候，再触发信号通知。
如果这个进程现在被挂起了，例如无事可做 sleep 了，那就把这个进程唤醒，下次有 CPU 空闲的时候，就会调度到这个进程，触发信号通知。

异步 API 说来轻巧，做来难，这主要是对 API 的实现者而言的。Linux 的异步 IO（AIO）支持是 2.6.22 才引入的，还有很多系统调用不支持异步 IO。Linux 的异步 IO 最初是为数据库设计的，因此通过异步 IO 的读写操作不会被缓存或缓冲，这就无法利用操作系统的缓存与缓冲机制。

很多人把 Linux 的 O_NONBLOCK 认为是异步方式，但事实上这是前面讲的同步非阻塞方式。需要指出的是，虽然 Linux 上的 IO API 略显粗糙，但每种编程框架都有封装好的异步 IO 实现。操作系统少做事，把更多的自由留给用户，正是 UNIX 的设计哲学，也是 Linux 上编程框架百花齐放的一个原因。

从前面 IO 模型的分类中，我们可以看出 AIO 的动机：

同步阻塞模型需要在 IO 操作开始时阻塞应用程序。这意味着不可能同时重叠进行处理和 IO 操作。
同步非阻塞模型允许处理和 IO 操作重叠进行，但是这需要应用程序根据重现的规则来检查 IO 操作的状态。
这样就剩下异步非阻塞 IO 了，它允许处理和 IO 操作重叠进行，包括 IO 操作完成的通知。

IO多路复用除了需要阻塞之外，select 函数所提供的功能（异步阻塞 IO）与 AIO 类似。不过，它是对通知事件进行阻塞，而不是对 IO 调用进行阻塞。

小结

同步IO模型要求用户代码自动执行I/O操作（将数据从内核缓冲区读入用户缓冲区，或将数据从用户缓冲区写入内核缓冲区）。而异步IO机制则由内核来执行I/O操作（数据在内核缓冲区和用户缓冲区之间移动是由内核在“后台”完成的）；
同步I/O向应用程序通知的是I/O就绪事件，异步I/O向应用程序通知的是I/O完成事件；

喜欢恋着风

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Linux中的五种I/O模型

概念说明用户空间和内核空间现在操作系统都是采用虚拟存储器，那么对32位操作系统而言，它的寻址空间（虚拟存储空间）为4G（2的32次方）。操作系统的核心是内核，独立于普通的应用程序，可以访问受保护的内存空间，也有访问底层硬件设备的所有权限。为了保证用户进程不能直接操作内核（kernel），保证内核的安全，操作系统将虚拟空间划分为两部分，一部分是内核空间，一部分是用户空间。针对Linux OS而言，将最
复制链接

扫一扫

专栏目录