【Redis】多路复用IO、Reactor模型

最新推荐文章于 2024-07-22 08:39:34 发布

sun_tantan

最新推荐文章于 2024-07-22 08:39:34 发布

阅读量1.1k

点赞数

分类专栏：框架大集合文章标签： redis java

本文链接：https://blog.csdn.net/sun_tantan/article/details/119748488

版权

框架大集合专栏收录该内容

17 篇文章 2 订阅

订阅专栏

面试官：说说Redis之I/O多路复用模型实现原理
 Redis 多线程网络模型全面揭秘
 五分钟快速理解 Reactor 模型

一、UnixIO的五种类型

一个输入操作通常包括两个阶段:

等待数据准备好：等待数据从网络中到达。当所等待分组到达时，它被复制到内核中的某个缓冲区。
从内核向进程复制数据：把数据从内核缓冲区复制到应用进程缓冲区。

一般情况下有5种类型：

1. 阻塞式 I/O

应用进程被阻塞，直到数据被复制到应用进程缓冲区（其他程序还可以执行，因此不消耗 CPU 时间，这种模型的执行效率会比较高）。

2. 非阻塞式 I/O

应用进程进行系统调用后，内核返回一个错误码。应用进程可以继续执行，但是需要不断的执行系统调用来获知 I/O 是否完成，这种方式称为轮询(polling)。由于 CPU 要处理更多的系统调用，因此这种模型是比较低效的。

3. I/O 复用(select 和 poll)

使用 select 或者 poll 等待数据，并且可以等待多个套接字中的任何一个变为可读，这一过程会被阻塞，当某一个套接字可读时返回。之后再使用 recvfrom 把数据从内核复制到进程中。它可以让单个进程具有处理多个 I/O 事件的能力。又被称为 Event Driven I/O，即事件驱动 I/O。

如果一个 Web 服务器没有 I/O 复用，那么每一个 Socket 连接都需要创建一个线程去处理。如果同时有几万个连接，那么就需要创建相同数量的线程。并且相比于多进程和多线程技术，I/O 复用不需要进程线程创建和切换的开销，系统开销更小。

4. 信号驱动式 I/O(SIGIO)

应用进程使用 sigaction 系统调用，内核立即返回，应用进程可以继续执行，也就是说等待数据阶段应用进程是非阻塞的。

内核在数据到达时向应用进程发送 SIGIO 信号，应用进程收到之后在信号处理程序中调用 recvfrom 将数据从内核复制到应用进程中。相比于非阻塞式 I/O 的轮询方式，信号驱动 I/O 的 CPU 利用率更高。

5. 异步 I/O(AIO)

进行 aio_read 系统调用会立即返回，应用进程继续执行，不会被阻塞，内核会在所有操作完成之后向应用进程发送信号。异步 I/O 与信号驱动 I/O 的区别在于，异步 I/O 的信号是通知应用进程 I/O 完成，而信号驱动 I/O 的信号是通知应用进程可以开始 I/O。

在这里插入图片描述

IO类型	同步/异步	等待数据	复制数据
阻塞式IO	同步	阻塞	阻塞
非阻塞式IO	同步	非阻塞、立即返回、轮询	阻塞
IO复用	同步	事件驱动，同时等待多个socket中的数据、其中一个返回了结果即返回	阻塞
信号驱动式IO	同步	非阻塞	阻塞
异步IO	异步	非阻塞	非阻塞

二、多路复用IO

Redis 为何选择单线程？

Redis 的核心网络模型选择用单线程来实现，这在一开始就引起了很多人的不解，Redis 官方的对于此的回答是：

It’s not very frequent that CPU becomes your bottleneck with Redis, as usually Redis is either memory or network bound. For instance, using pipelining Redis running on an average Linux system can deliver even 1 million requests per second, so if your application mainly uses O(N) or O(log(N)) commands, it is hardly going to use too much CPU.

核心意思就是，对于一个 DB 来说，CPU 通常不会是瓶颈，因为大多数请求不会是 CPU 密集型的，而是 I/O 密集型。具体到 Redis 的话，如果不考虑 RDB/AOF 等持久化方案，Redis 是完全的纯内存操作，执行速度是非常快的，因此这部分操作通常不会是性能瓶颈，Redis 真正的性能瓶颈在于网络 I/O，也就是客户端和服务端之间的网络传输延迟，因此 Redis 选择了单线程的 I/O 多路复用来实现它的核心网络模型。

为什么Redis中要使用 I/O 多路复用？

因为 Redis 是跑在单线程中的，所有的操作都是按照顺序线性执行。但是由于读写操作等待用户输入或输出都是阻塞的，所以 I/O 操作在一般情况下往往不能直接返回，这会导致某一文件的 I/O 阻塞导，致整个进程无法对其它客户提供服务。

而 I/O 多路复用就是为了解决这个问题而出现的。为了让单线程（进程）的服务端应用同时处理多个客户端的事件，Redis 采用了 IO 多路复用机制。

Redis中的多路复用模型

文件描述符(file descriptor)
Linux 系统中，把一切都看做是文件，当进程打开现有文件或创建新文件时，内核向进程返回一个文件描述符。可以理解文件描述符是一个索引，这样，要操作文件的时候，我们直接找到索引就可以对其进行操作了。我们将这个索引叫做文件描述符（file descriptor），简称fd。

一个socket客户端与服务端连接时，会生成对应一个套接字描述符（套接字描述符是文件描述符的一种），每一个socket网络连接其实都对应一个文件描述符。
多个客户端与服务端连接时，Redis 使用 I/O 多路复用程序将客户端socket对应的FD注册到 监听列表（一个队列） 中。当客服端执行 read、write 等操作命令时，I/O 多路复用程序会将命令封装成一个事件，并绑定到对应的 fd 上。
文件事件处理器使用 I/O 多路复用模块同时监控多个文件描述符（fd）的读写情况，当 accept、read、write 和 close 文件事件产生时，文件事件处理器就会回调 fd 绑定的事件处理器进行处理相关命令操作。
整个文件事件处理器是在单线程上运行的，但是通过 I/O 多路复用模块的引入，实现了同时对多个fd读写的监控，当其中一个 client 端达到写或读的状态，文件事件处理器就马上执行，从而就不会出现 I/O 堵塞的问题，提高了网络通信的性能。
如上图，Redis 的 I/O 多路复用模式使用的是Reactor模式的方式来实现。

三、Reactor模型

阻塞IO模型的特点：

采用阻塞式 I/O 模型获取输入数据
每个连接都需要独立的线程完成数据输入，业务处理，数据返回的完整操作。

其存在的问题：

当并发数较大时，需要创建大量线程来处理连接，系统资源占用较大；
连接建立后，如果当前线程暂时没有数据可读，则线程就阻塞在 Read 操作上，造成线程资源浪费。

针对传统阻塞 I/O 服务模型的 2 个缺点，比较常见的有如下解决方案：

I/O 复用模型
多个连接共用一个阻塞对象，应用程序只需要在一个阻塞对象上等待，无需阻塞等待所有连接。当某条连接有新的数据可以处理时，操作系统通知应用程序，线程从阻塞状态返回，开始进行业务处理；
线程池复用线程资源
不必再为每个连接创建线程，将连接完成后的业务处理任务分配给线程进行处理，一个线程可以处理多个连接的业务。

I/O 复用结合线程池，这就是 Reactor 模式基本设计思想

在这里插入图片描述
Reactor 模式中有 2 个关键组成：