四种主要的IO模型

最新推荐文章于 2023-05-31 09:41:29 发布

lxy-up

最新推荐文章于 2023-05-31 09:41:29 发布

阅读量857

点赞数 3

分类专栏：操作系统文章标签：内核 java linux

本文链接：https://blog.csdn.net/qq_41051923/article/details/110082229

版权

操作系统专栏收录该内容

2 篇文章 1 订阅

订阅专栏

文章目录

前言
1、同步阻塞IO（Blocking IO）
2、同步非阻塞IO（Non-blocking IO）
3、IO多路复用模型（IO Multiplexing）
- 几种系统调用的区别：
4、异步IO模型（Asynchronous IO）
- 流程（以一次socket的read读操作系统调用为例）：

前言

常见的IO模型有四种：同步阻塞IO、同步非阻塞IO、IO多路复用、异步IO。其中，

阻塞与非阻塞的区别
阻塞与非阻塞都指的是用户空间程序的执行状态。阻塞IO指的是需要内核IO操作彻底完成后，才返回到用户空间执行用户的操作。
阻塞是指用户空间（调用线程）一直在等待，而不能干别的事情；非阻塞是指用户空间（调用线程）拿到内核返回的状态值就返回自己的空间，就可以去完成别的任务。
同步与异步的区别
同步IO是一种用户空间与内核空间的IO发起方式。同步IO是指用户空间的线程是主动发起IO请求的一方，内核空间是被动接收方；异步IO是指系统内核是主动发起IO请求的一方，用户空间的线程是被动接受方。

1、同步阻塞IO（Blocking IO）

在Java中，默认创建的socket都是阻塞的。由用户空间向内核空间发起IO请求，等到内核IO操作彻底完成后，才返回到用户空间执行用户操作。
在阻塞式IO模型中，Java程序从IO系统调用开始，直到系统调用返回，在这段时间内，Java进程是阻塞的。返回成功后，应用进程开始处理用户空间的缓存区数据。

## 流程（以一次socket的read读操作系统调用为例）： 1. 从Java启动IO读的read系统调用开始，用户线程就进入阻塞状态。 2. 当系统内核收到read系统调用，就开始准备数据。一开始，数据可能还没有到达内核缓冲区（例如还未收到一个完整的socket数据包），这个时候内核就要开始等待。 3. 内核一直等到完整的数据到达，就会将数据从内核缓冲区复制到用户缓冲区（用户空间的内存），然后内核返回结果（例如返回复制到用户缓冲区中的字节数）。 4. 直到内核返回后，用户线程才会解除阻塞的状态，重新运行。

优点	缺点
1. 应用程序开发简单；2.在阻塞等待数据期间，用户线程挂起，基本不会占用CPU资源。	一般情况下，会为每个连接配备一个独立的线程，每个线程维护一个连接的IO操作

当在高并发的应用场景下，需要大量的线程来维护大量的网络连接，内存、线程切换开销巨大。阻塞IO不适合在高并发应用场景下。

2、同步非阻塞IO（Non-blocking IO）

同步非阻塞IO简称为NIO模式。由用户空间主动发起IO请求，但是用户空间的程序不需要等待内核IO操作彻底完成，可以立即返回用户空间执行用户的操作，即处于非阻塞状态，与此同时，内核会立即返回给用户一个状态值。
在NIO模型中，应用程序一旦开始IO系统调用，会出现以下两种情况：

在内核缓冲区中没有数据的情况下，系统调用会立即返回，返回一个调用失败的信息。
在内核缓冲区中有数据的情况下，是阻塞的，直到数据从内核缓冲复制到用户进程缓冲。复制完成后，系统调用返回成功，应用进程开始处理用户空间的缓存数据。

## 流程（以一次socket的read读操作系统调用为例）：

在内核数据没有准备好的阶段，用户线程发起IO请求时，立即返回。所以为了读取到最终的数据，用户线程需要不断地发起IO系统调用。
内核数据到达时，用户线程发起系统调用，用户线程阻塞。内核开始复制数据，它会将数据从内核缓冲区复制到用户缓冲区（用户空间的内存），然后内核返回结果（例如返回复制到用户缓冲区中的字节数）。
用户线程读到数据后，才会解除阻塞状态，重新运行起来。

同步非阻塞IO的特点：应用程序的线程需要不断地进行IO系统调用，轮询数据是否已经准备好。如果没有准备好，就继续轮询，直到完成IO系统调用为止。即一次IO请求可能无法获取数据。

优点	缺点
每次发起的IO系统调用，在内核等待数据过程中可以立即返回。用户线程不会阻塞，实时性较好。	不断地轮询内核，会占用大量的CPU时间，效率低下。

3、IO多路复用模型（IO Multiplexing）

为了避免同步非阻塞IO模型中轮询等待的问题，有了IO多路复用模型。在IO多路复用模型中，用到了一种新的系统调用，用于查询IO的就绪状态。在Linux系统中，对应的系统调用为select/poll、epoll系统调用。通过该系统调用，一个进程可以监视多个文件描述符，一旦某个描述符就绪（内核缓冲区可读/可写），内核能够将就绪的状态返回给应用程序。随后，应用程序根据就绪的状态，进行相应的IO系统调用（读写过程为阻塞状态）。

几种系统调用的区别：

1.select

时间复杂度为O(n)。select 的核心功能是调用tcp文件系统的poll函数，不停的查询，若是没有想要的数据，主动执行一次调度（防止一直占用cpu），直到有一个链接有想要的消息为止。select的执行方式基本就是不停的调用poll，直到有需要的消息为止。

优点

①. select的可移植性更好，在某些Unix系统上不支持poll()。
②. select对于超时值提供了更好的精度：微秒，而poll是毫秒。

缺点

①. 每次调用select，都须要把fd（文件描述符）集合从用户态拷贝到内核态，这个开销在fd不少时会很大；
②. 同时每次调用select都须要在内核遍历传递进来的全部fd，这个开销在fd不少时也很大；
③. select支持的文件描述符数量过小了，默认是1024。

2.poll

poll本质上和select没有区别，它将用户传入的数组拷贝到内核空间，而后查询每一个fd对应的设备状态，若是设备就绪则在设备等待队列中加入一项并继续遍历，若是遍历完全部fd后没有发现就绪设备，则挂起当前进程，直到设备就绪或者主动超时，被唤醒后它又要再次遍历fd。这个过程经历了屡次无谓的遍历。poll还有一个特色是“水平触发”，若是报告了fd后，没有被处理，那么下次poll时会再次报告该fd。

优点

①. poll() 不要求开发者计算最大文件描述符加一的大小。

②. poll() 在应付大数目的文件描述符的时候速度更快，相比于select。

③. 它没有最大链接数的限制，缘由是它是基于链表来存储的。

缺点

①. 大量的fd的数组被总体复制于用户态和内核地址空间之间，而无论这样的复制是否是有意义；
②. 与select同样，poll返回后，须要轮询pollfd来获取就绪的描述符。

3.epoll

epoll是在Linux2.6内核中提出的，是之前的select和poll的增强版本。相对于select和poll来说，epoll更加灵活，没有描述符限制。epoll使用一个文件描述符管理多个描述符，将用户关系的文件描述符的事件存放到内核的一个事件表中，这样在用户空间和内核空间的copy只需一次。

三者区别

select，poll实现须要本身不断轮询全部fd集合，直到设备就绪，期间可能要睡眠和唤醒屡次交替。而epoll其实也须要调用epoll_wait不断轮询就绪链表，期间也可能屡次睡眠和唤醒交替，可是它是设备就绪时，调用回调函数，把就绪fd放入就绪链表中，并唤醒在epoll_wait中进入睡眠的进程。虽然都要睡眠和交替，可是select和poll在“醒着”的时候要遍历整个fd集合，而epoll在“醒着”的时候只要判断一下就绪链表是否为空即可，这节省了大量的CPU时间。这就是回调机制带来的性能提高。

4、异步IO模型（Asynchronous IO）

异步IO模型（Asynchronous IO，简称为AIO）。AIO的基本流程是：用户线程通过系统调用，向内核注册某个IO操作。内核在整个IO操作（包括数据准备、数据复制）完成后，通知用户程序，用户执行后序的业务操作。在异步IO模型中，用户程序都不会发生阻塞。

流程（以一次socket的read读操作系统调用为例）：

当用户线程发起了read系统调用，立即就可以去做其他的事，用户线程不阻塞。
内核开始IO的第一个阶段：准备数据。等到数据准备好，内核就会将数据从内核缓冲区复制到用户缓冲区（用户空间的内存）。
内核会给用户线程发送一个信号（Singal），或者回调用户线程注册的回调接口，告诉用户线程read操作完成。
用户线程读取用户缓冲区的数据，完成后续的业务操作。

异步IO模型的特点：在内核等待数据和复制数据的两个阶段，用户线程都不是阻塞的。用户线程需要接受内核的IO操作完成的事件，或者用户线程需要注册一个IO操作完成的回调函数。异步IO也被称为信号驱动IO。

优点	缺点
异步IO是真正的异步输入输出，它的吞吐量高于IO多路复用	应用程序仅需要进行事件的注册和接收，其余的工作都留给了操作系统，需要底层内核的支持。

目前只有Windows系统下通过IOCP实现了真正的异步IO，在Linux系统下，异步IO底层实现仍使用epoll，与IO多路复用相同，在性能上没有明显的优势。

lxy-up

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
四种主要的IO模型

文章目录前言1、同步阻塞IO（Blocking IO）流程：2、同步非阻塞IO（Non-blocking IO）二、使用步骤1.引入库2.读入数据总结前言常见的IO模型有四种：同步阻塞IO、同步非阻塞IO、IO多路复用、异步IO。其中，阻塞与非阻塞的区别阻塞与非阻塞都指的是用户空间程序的执行状态。阻塞IO指的是需要内核IO操作彻底完成后，才返回到用户空间执行用户的操作。阻塞是指用户空间（调用线程）一直在等待，而不能干别的事情；非阻塞是指用户空间（调用线程）拿到内核返回的状态值
复制链接

扫一扫