五种网络I/O模型

最新推荐文章于 2024-09-30 08:05:35 发布

懵懂的小新

最新推荐文章于 2024-09-30 08:05:35 发布

阅读量193

点赞数

文章标签： linux 网络通信

本文链接：https://blog.csdn.net/AJIEIT/article/details/105344440

版权

五种网络I/O模型

1.四种调节方式

在Linux下进行网络编程时，我们常常见到同步(Sync)/异步(Async)，阻塞(Block)/非阻塞(Unblock)四种调用方式：

同步和异步的概念描述的是用户线程与内核的交互方式：同步是指用户线程发起IO请求后需要等待或者轮询内核IO操作完成后才能继续执行；而异步是指用户线程发起IO请求后仍继续执行，当内核IO操作完成后会通知用户线程，或者调用用户线程注册的回调函数。

阻塞和非阻塞的概念描述的是用户线程调用内核IO操作的方式：阻塞是指IO操作在没有接收完数据或者没有得到结果之前不会返回，需要彻底完成后才返回到用户空间；而非阻塞是指IO操作被调用后立即返回给用户一个状态值，无需等到IO操作彻底完成。

2.五种模型

同步阻塞IO（Blocking IO）：即传统的IO模型，在linux中默认情况下所有的socket都是阻塞模式。当用户进程调用了 read()这个系统调用，内核就开始了IO的第一个阶段：准备数据。对于网络IO来说，很多时候数据在一开始还没有到达（比如，还没有收到一个完整的UDP包），这个时候内核就要等待足够的数据到来。而在用户进程这边，整个进程会被阻塞。当内核一直等到数据准备好了，它就会将数据从内核中拷贝到用户内存，然后内核返回结果，用户进程才解除阻塞的状态，重新运行起来；几乎所有的程序员第一次接触到的网络编程都是从listen()、read()、write() 等接口开始的，这些接口都是阻塞型的，一个简单的改进方案是在服务器端使用多线程（或多进程）。多线程（或多进程）的目的是让每个连接都拥有独立的线程（或进程），这样任何一个连接的阻塞都不会影响其他的连接。
图例：
同步非阻塞IO（Non-blocking IO）：默认创建的socket都是阻塞的，同步非阻塞IO是在同步阻塞IO的基础上，将socket 设置为NONBLOCK，这个可以使用ioctl()系统调用设置。这样做用户线程可以在发起IO请求后可以立即返回，如果该次读操作并未读取到任何数据，用户线程需要不断地发起IO请求，直到数据到达后，才真正读取到数据，继续执行。整个IO请求的过程中，虽然用户线程每次发起IO请求后可以立即返回，但是为了等到数据，仍需要不断地轮询、重复请求，消耗了大量的CPU的资源。一般很少直接使用这种模型，而是在其他IO模型中使用非阻塞IO这一特性。
图例：
IO多路复用（IO Multiplexing）：IO多路复用模型是建立在内核提供的多路分离函数select基础之上的，使用select函数可以避免同步非阻塞IO模型中轮询等待的问题，此外poll、epoll都是这种模型。在该种模式下，用户首先将需要进行IO操作的 socket添加到select中，然后阻塞等待select系统调用返回。当数据到达时，socket被激活，select函数返回。用户线程正式发起 read请求，读取数据并继续执行。从流程上来看，使用select函数进行IO请求和同步阻塞模型没有太大的区别，甚至还多了添加监视socket，以及调用select函数的额外操作，效率更差。但是，使用select以后最大的优势是用户可以在一个线程内同时处理多个socket的IO请求。用户可以注册多个socket，然后不断地调用select读取被激活的socket，即可达到在同一个线程内同时处理多个IO请求的目的。而在同步阻塞模型中，必须通过多线程的方式才能达到这个目的。

图例：
在这里插入图片描述

信号驱动IO（signal driven IO）：调用sigaltion系统调用，当内核中IO数据就绪时以SIGIO信号通知请求进程，请求进程再把数据从内核读入到用户空间，这一步是阻塞的。
异步IO（Asynchronous IO）：即经典的Proactor设计模式，也称为异步非阻塞IO。“真正”的异步IO需要操作系统更强的支持。在IO多路复用模型中，事件循环将文件句柄的状态事件通知给用户线程，由用户线程自行读取数据、处理数据。而在异步IO模型中，当用户线程收到通知时，数据已经被内核读取完毕，并放在了用户线程指定的缓冲区内，内核在IO完成后通知用户线程直接使用即可。

3.五种方式的对比

相比于IO多路复用模型，信号驱动IO和异步IO并不十分常用，不少高性能并发服务程序使用IO多路复用模型+多线程任务处理的架构基本可以满足需求。况且目前操作系统对异步IO的支持并非特别完善，更多的是采用IO多路复用模型模拟异步IO的方式。在这里我们把前三种做一个形象地类比：

阻塞IO, 给客户端发一条信息, 然后就默默的一直等着客户端回信, 这个期间除了等待你不会做其他事情；
非阻塞IO, 给客户端发信息, 如果不回, 接着再发, 一直发到客户端回消息, 这个期间你除了发信息等待不会做其他事情；
IO多路复用, 是设置一个“监视器”来帮你监视所有客户端回复的信息, 这个期间你可以些其他的事情。IO复用又包括 select, poll, epoll 模式. 那么它们的区别是什么?

select“监视器” 每一个客户端回复消息， select“监视器”都不知道这个是不是你对应的客户端回复的消息, 她需要一个一个询问, 并且select“监视器”能力还有限, 最多一次帮你监视1024个客户端；
poll“监视器” 不限制监视客户端的数量, 只要是客户端回复的消息, 都会去查询是不是你对应的客户端回复的消息；
epoll“监视器” 不限制监视客户端的数量, 并且也不需要一个一个去查询. 那么如何做呢? epoll“监视器”会为每个客户端做一个不一样的“标记”,只有你对应的客户端回消息了，看到“标记”， epoll“监视器”就知道这个是不是你对应的客户端了, 然后“监视器”再通知你；

相比于其他的IO模型，多路复用是最高效和最实用的，其中的epoll也是相比最好用的。