五种IO（输入/输出）模型

俊星学长

于 2024-10-10 14:46:56 发布

阅读量904

点赞数 29

文章标签：网络 linux 运维

本文链接：https://blog.csdn.net/m0_70066267/article/details/142821605

版权

Linux操作系统提供了五种主要的IO（输入/输出）模型，这些模型旨在优化应用程序对输入输出操作的管理和处理。以下是关于这五种IO模型的详细介绍

一、阻塞IO（Blocking IO）

阻塞IO是最常见、最传统的IO模型。在这种模型中，当用户进程发起一个IO请求后，内核会一直等待，直到IO操作完成并返回结果。在此期间，用户进程会被阻塞，无法进行其他操作。

1. 工作原理

当用户进程调用如recvfrom这样的系统调用时，内核会开始IO的第一个阶段：准备数据。对于网络IO来说，很多时候数据在一开始还没有到达，比如还没有收到一个完整的UDP包。这时，内核会等待足够的数据到来。这个过程需要等待，也就是说数据被拷贝到操作系统内核的缓冲区中是需要一个过程的。而在用户进程这边，整个进程会被阻塞，直到内核等到数据准备好了，才会将数据从内核中拷贝到用户内存，然后返回结果，用户进程才解除阻塞状态，重新运行起来。

2. 特点

简单易用：阻塞IO模型易于理解和实现，开发者不需要处理复杂的IO状态检查和轮询。
效率不高：由于用户进程在IO操作期间被阻塞，无法执行其他任务，导致CPU资源利用率低。
适用场景：阻塞IO模型通常适用于单线程、同步、串行的应用程序，如文件传输、打印机等。

3. 示例

假设一个用户进程需要从套接字读取数据。在阻塞IO模型中，当用户进程调用recv函数时，如果套接字缓冲区没有就绪数据包，进程状态将从TASK_RUNNING切换至TASK_INTERRUPTIBLE状态，并通过进程调度完成进程阻塞。同时，进程也会加入到套接字等待队列，等待数据到来后被唤醒。当网卡收到数据包后，通过DMA机制将数据包拷贝到内核空间RingBuffer，并通过中断机制将数据包拷贝至套接字接收缓冲区。套接字接收到数据包后，会唤醒等待队列中的休眠进程。进程被唤醒后继续完成用户空间和内核空间的数据同步，recv函数成功返回。

二、非阻塞IO（Non-blocking IO）

非阻塞IO是在阻塞IO的基础上进行改进的一种IO模型。在这种模型中，当用户进程发起一个IO请求后，内核会立即返回一个错误码，表示IO操作还未完成。用户进程可以继续进行其他操作，随后再通过轮询的方式来查询IO操作是否完成。

1. 工作原理

当用户进程调用如recv这样的非阻塞IO函数时，如果套接字缓冲区没有就绪数据包，recv函数会立即返回EWOULDBLOCK错误码。用户进程可以一直调用recv函数，直到数据准备好为止。在非阻塞IO模型中，用户进程需要不断地询问内核数据是否就绪，也就是说非阻塞IO不会交出CPU，而会一直占用CPU。

2. 特点

避免阻塞：非阻塞IO模型允许用户进程在IO操作期间执行其他任务，提高了CPU资源的利用率。
轮询开销：由于用户进程需要不断地询问内核数据是否就绪，这会导致CPU占用率非常高，因此一般情况下很少使用while循环这种方式来读取数据。
适用场景：非阻塞IO模型适用于需要同时处理多个IO操作的应用程序，如服务器程序中的多客户端连接处理。

3. 示例

假设一个用户进程需要从套接字读取数据。在非阻塞IO模型中，当用户进程调用recv函数时，如果套接字缓冲区没有就绪数据包，recv函数会立即返回EWOULDBLOCK错误码。用户进程可以一直调用recv函数，直到数据准备好为止。在这个过程中，用户进程可以继续执行其他任务，如处理其他客户端的连接请求。当数据准备好后，用户进程再次调用recv函数，成功读取数据。

三、IO复用（IO Multiplexing）

IO复用是指通过select、poll、epoll等系统调用来监听多个文件描述符的IO事件。当某个文件描述符就绪时（一般是读就绪或者写就绪），内核会通知用户进程进行IO操作。

1. 工作原理

IO复用模型允许一个进程同时监视多个文件描述符，当其中任意一个文件描述符就绪时，就可以进行相应的IO操作。相比于阻塞IO和非阻塞IO，IO复用可以同时监听多个文件描述符，提高了IO效率。在Linux中，常用的IO复用模型有select、poll、epoll等。

select：通过位图实现IO复用，将socket注册到读、写或异常位图，通过select系统调用轮询位图，获取socket事件。成功获取到socket事件后，select成功返回，此时可以通过接收函数读取socket缓冲区数据。
poll：和select非常相似，主要区别为poll将位图改成链表。poll通过链表实现IO复用，将socket注册到poll_list链表，通过poll系统调用轮询链表，获取socket事件。成功获取到socket事件后，poll成功返回，此时可以通过接收函数读取socket缓冲区数据。
epoll：采用回调方式获取就绪socket事件，相比于select和poll模型的轮询方式效率更高。通过epoll_ctl系统调用注册socket事件至红黑树，当socket接收到数据后，通过回调函数将socket事件添加至就绪队列。调用epoll_wait查询就绪队列就能获取到socket事件。

2. 特点

高效：IO复用模型可以同时监听多个文件描述符，提高了IO效率。
适用场景：IO复用模型适用于需要同时处理多个IO操作的应用程序，如服务器程序中的多客户端连接处理。

3. 示例

假设一个服务器程序需要同时处理多个客户端的连接请求。在IO复用模型中，服务器程序可以使用epoll系统调用来监听所有客户端的连接请求。当某个客户端的连接请求到达时，epoll会通知服务器程序进行相应的处理。服务器程序可以读取客户端发送的数据，并返回响应。这样，服务器程序就可以同时处理多个客户端的连接请求，提高了并发处理能力。

四、信号驱动IO（Signal-driven IO）

信号驱动IO是指用户进程通过signal或sigaction系统调用来注册一个信号处理函数。当IO操作完成时，内核会向用户进程发送一个SIGIO信号，用户进程在信号处理函数中进行IO操作。

1. 工作原理

用户进程首先注册一个SIGIO信号处理函数。当内核收到数据后，会发送SIGIO信号给用户进程。用户进程在信号处理函数中调用如recv这样的函数来完成IO操作。

2. 特点

避免阻塞：信号驱动IO模型可以避免用户进程被阻塞，提高了IO效率。
复杂性：信号驱动IO模型需要处理信号处理函数的注册和调用，增加了程序的复杂性。
适用场景：信号驱动IO模型适用于需要处理大量IO操作且不希望被阻塞的应用程序。

3. 示例

假设一个用户进程需要从套接字读取数据。在信号驱动IO模型中，用户进程首先通过signal或sigaction系统调用来注册一个SIGIO信号处理函数。当内核收到数据后，会发送SIGIO信号给用户进程。用户进程在信号处理函数中调用recv函数来读取数据。这样，用户进程就可以在不被阻塞的情况下处理IO操作。

五、异步IO（Asynchronous IO）

异步IO是指当用户进程发起一个IO请求后，内核会立即返回，表示IO操作已经开始。当IO操作完成后，内核会通知用户进程，用户进程在此时才进行IO操作。

1. 工作原理

在异步IO模型中，用户进程发起IO请求后，内核会立即返回。用户进程可以继续执行其他任务。当IO操作完成后，内核会通过通知机制（如回调函数）来通知用户进程。用户进程在收到通知后，再进行IO操作。

2. 特点

高效：异步IO模型允许用户进程在IO操作期间执行其他任务，提高了CPU资源的利用率。
复杂性：异步IO模型需要处理通知机制和回调函数的注册和调用，增加了程序的复杂性。
适用场景：异步IO模型适用于需要处理大量IO操作且对响应时间有严格要求的应用程序。

3. 示例

假设一个用户进程需要从套接字读取数据。在异步IO模型中，用户进程发起IO请求后，内核会立即返回。用户进程可以继续执行其他任务。当数据准备好后，内核会通过回调函数来通知用户进程。用户进程在收到通知后，调用如recv这样的函数来读取数据。这样，用户进程就可以在不被阻塞的情况下处理IO操作，并且能够在数据准备好后立即进行处理。