高性能网络模式：Reactor 的原理与思考

最新推荐文章于 2023-08-27 18:16:06 发布

UPUP小亮

最新推荐文章于 2023-08-27 18:16:06 发布

阅读量680

点赞数

分类专栏：高性能网络框架文章标签：网络 linux c++

本文链接：https://blog.csdn.net/weixin_44545838/article/details/131023229

版权

高性能网络框架专栏收录该内容

9 篇文章 3 订阅

订阅专栏

文章目录

前言
一、高性能网络模式的演变
二、Reactor模式
四、muduo网络模型
与proactor的区别总结

前言

Reactor 模式和 Proactor 模式都是处理并发 I/O 事件的设计模式。它们各自的核心思想是将 I/O 操作与实际处理逻辑解耦。
本文将详细介绍高性能网络模式**：Reactor 和 Proactor 的原理**，并通过 C++ 代码示例来展示它们的实现。我们将深入探讨这两种模式的优缺点，以及如何在实际项目中应用它们。

一、高性能网络模式的演变

1、要让服务器服务多个客户端，那么最直接的方式就是为每一条连接创建线程。
处理完业务逻辑后，随着连接关闭后线程也同样要销毁了，但是这样不停地创建和销毁线程，不仅会带来性能开销，也会造成浪费资源，而且如果要连接几万条连接，创建几万个线程去应对也是不现实的。
问题：要这么解决这个问题呢？我们可以使用「资源复用」的方式。
2、创建一个「线程池」，将连接分配给线程，然后一个线程可以处理多个连接的业务。
但是引入了线程池，那么一个线程要处理多个连接的业务，线程在处理某个连接的 read 操作时，如果遇到没有数据可读，就会发生阻塞，那么线程就没办法继续处理其他连接的业务。
问题：线程并不知道当前连接是否有数据可读，从而需要每次通过 read 去试探。
3、I/O 多路复用
I/O 多路复用技术会用一个系统调用函数来监听我们所有关心的连接，也就说可以在一个监控线程里面监控很多的连接。I/O 多路复用技术会用一个系统调用函数来监听我们所有关心的连接，也就说可以在一个监控线程里面监控很多的连接。检测多条连接是否准备就绪。内核处理检测 io是否准备通过select函数或者epoll函数返回给用户
select/poll/epoll 就是内核提供给用户态的多路复用系统调用，线程可以通过一个系统调用函数从内核中获取多个事件。在这里插入图片描述

io多路复用思想流程：
在获取事件时，先把我们要关心的连接传给内核，再由内核检测：
1、如果没有事件发生，线程只需阻塞在这个系统调用，而无需像前面的线程池方案那样轮训调用 read 操作来判断是否有数据。
2、如果有事件发生，内核会返回产生了事件的连接，线程就会从阻塞状态返回，然后在用户态中再处理这些连接对应的业务即可。

io多路复用之前已经详细介绍过了：
原理：io多路复用原理
实现：io多路复用实现
问题：用过 I/O 多路复用接口写网络程序的同学，肯定知道是面向过程的方式写代码的，这样的开发的效率不高。
4、基于面向对象的思想，对 I/O 多路复用作了一层封装，让使用者不用考虑底层网络 API 的细节，只需要关注应用代码的编写：Reactor 模式

Reactor 模式主要由 Reactor 和处理资源池这两个核心部分组成，它俩负责的事情如下：

Reactor 负责监听和分发事件，事件类型包含连接事件、读写事件；
处理资源池负责处理事件，如 read -> 业务逻辑 -> send；
Reactor 模式是灵活多变的，可以应对不同的业务场景，灵活在于：

Reactor 的数量可以只有一个，也可以有多个；
处理资源池可以是单个进程 / 线程，也可以是多个进程 /线程；
将上面的两个因素排列组设一下，理论上就可以有 4 种方案选择：

单 Reactor 单进程 / 线程；
单 Reactor 多进程 / 线程；
多 Reactor 单进程 / 线程；
多 Reactor 多进程 / 线程；
其中，「多 Reactor 单进程 / 线程」实现方案相比「单 Reactor 单进程 / 线程」方案，不仅复杂而且也没有性能优势，因此实际中并没有应用。

剩下的 3 个方案都是比较经典的，且都有应用在实际的项目中：

单 Reactor 单进程 / 线程；
单 Reactor 多线程 / 进程；
多 Reactor 多进程 / 线程；
方案具体使用进程还是线程，要看使用的编程语言以及平台有关：

Java 语言一般使用线程，比如 Netty;
C 语言使用进程和线程都可以，例如 Nginx 使用的是进程，Memcache 使用的是线程

二、Reactor模式

原理

Reactor 模式是一种事件驱动的网络模式，它通过一个事件循环来等待和分发事件。当一个事件发生时，Reactor 会调用相应的处理程序来处理事件。

单 Reactor 单进程 / 线程

单 Reactor 单进程的方案因为全部工作都在同一个进程内完成
在这里插入图片描述
1、Reactor 对象通过 select （IO 多路复用接口）监听事件，收到事件后通过 dispatch 进行分发，具体分发给 Acceptor 对象还是 Handler 对象，还要看收到的事件类型；
2、如果是连接建立的事件，则交由 Acceptor 对象进行处理，Acceptor 对象会通过 accept 方法获取连接，并创建一个 Handler 对象来处理后续的响应事件；
3、如果不是连接建立事件，则交由当前连接对应的 Handler 对象来进行响应；
4、Handler 对象通过 read -> 业务处理 -> send 的流程来完成完整的业务流程。

缺点
第一个缺点，因为只有一个进程，无法充分利用多核 CPU 的性能；
第二个缺点，Handler 对象在业务处理时，整个进程是无法处理其他连接的事件的，如果业务处理耗时比较长，那么就造成响应的延迟；

单 Reactor 多线程 / 多进程（Reactor+线程池）

引入多线程 / 多进程，单 Reactor 多线程 / 多进程的方案。
在这里插入图片描述 1、Reactor 对象通过 select （IO 多路复用接口）监听事件，收到事件后通过 dispatch 进行分发，具体分发给 Acceptor 对象还是 Handler 对象，还要看收到的事件类型；
2、如果是连接建立的事件，则交由 Acceptor 对象进行处理，Acceptor 对象会通过 accept 方法获取连接，并创建一个 Handler 对象来处理后续的响应事件；
3、如果不是连接建立事件，则交由当前连接对应的 Handler 对象来进行响应；
上面的三个步骤和单 Reactor 单线程方案是一样的，接下来的步骤就开始不一样了：

4、Handler 对象不再负责业务处理，只负责数据的接收和发送，Handler 对象通过 read 读取到数据后，会将数据发给子线程里的 Processor 对象进行业务处理；
5、子线程里的 Processor 对象就进行业务处理，处理完后，将结果发给主线程中的 Handler 对象，接着由 Handler 通过 send 方法将响应结果发送给 client；

缺点：
个 Reactor 对象承担所有事件的监听和响应，而且只在主线程中运行，在面对瞬间高并发的场景时，容易成为性能的瓶颈的地方。

多 Reactor 多进程 / 线程（Mutiple Reactor + ThreadPool）

也叫 one loop per thread + 线程池。既有多个Reactor来处理IO，也使用线程池来处理计算，这种模式适合既有突发IO，又有突发计算的应用。适用于网络密集型以及业务密集型。
在这里插入图片描述
加业务逻辑在线程池中进行处理。
1、主线程中的 MainReactor 对象通过 select 监控连接建立事件，收到事件后通过 Acceptor 对象中的 accept 获取连接，将新的连接分配给某个子线程；
2、子线程中的 SubReactor 对象将 MainReactor 对象分配的连接加入 select 继续进行监听，并创建一个 Handler 用于处理连接的响应事件。
3、如果有新的事件发生时，SubReactor 对象会调用当前连接对应的 Handler 对象来进行响应。
Handler 对象通过 read -> 业务处理 -> send 的流程来完成完整的业务流程
主从reactor之分，Main Reactor只用于监听新的连接，在accept之后就会将这个连接分配到Sub Reactor上，由子Reactor负责连接的事件处理。
而线程池中维护了两个队列，一个队伍队列，一个线程队列，外部线程将任务添加到任务队列中，如果线程队列非空，则会唤醒其中一只线程进行任务的处理，相当于是生产者和消费者模

四、muduo网络模型

muduo库的Multiple Reactors模型如下：
在这里插入图片描述
图中所谓的反应堆reactor，实际上都是代表着Demultiplex事件分发器，由他们监听具体事件的发生，调用相应事件的回调，
Multiple Reactors实际上就是把各个Reactor的主要任务做了拆分，mainReactor一般为1个，主要负责处理即将到来的新连接，把建立的句柄注册到subReactor上，然后subReactor负责处理已连接句柄的读写事件。
reactor实际上是reactor和Demultiplex事件分发器的合二为一。
多路事件分发器想象成epoll，mainreactor相当于I/O线程的eventloop，主要做的是新用户的连接accept，listen fd有事件写入，就accept取出已连接用户的fd，然后派送到具体的工作线程上。
subreactor线程专门做已连接用户的读写事件处理
如果再有耗时的I/O操作，比如说传输文件，就单独再起一个线程去处理耗时的I/O操作

与proactor的区别总结

Proactor模式是一种基于事件驱动的网络编程模式。与Reactor模式不同的是，Proactor模式将I/O操作交给操作系统处理，当操作系统完成数据准备和传输时，操作系统会通知应用程序进行后续处理。这里的事件可以指数据可读/可写，连接建立/断开等等。
在Proactor模式下，主线程负责发起异步I/O请求，当操作系统完成数据准备和传输时，主线程才会触发回调函数执行对应的业务逻辑。
阻塞 I/O 好比，你去饭堂吃饭，但是饭堂的菜还没做好，然后你就一直在那里等啊等，等了好长一段时间终于等到饭堂阿姨把菜端了出来（数据准备的过程），但是你还得继续等阿姨把菜（内核空间）打到你的饭盒里（用户空间），经历完这两个过程，你才可以离开。

非阻塞 I/O 好比，你去了饭堂，问阿姨菜做好了没有，阿姨告诉你没，你就离开了，过几十分钟，你又来饭堂问阿姨，阿姨说做好了，于是阿姨帮你把菜打到你的饭盒里，这个过程你是得等待的。

异步 I/O 好比，你让饭堂阿姨将菜做好并把菜打到饭盒里后，把饭盒送到你面前，整个过程你都不需要任何等待。

很明显，异步 I/O 比同步 I/O 性能更好，因为异步 I/O 在「内核数据准备好」和「数据从内核空间拷贝到用户空间」这两个过程都不用等待。

Reactor 是非阻塞同步网络模式，感知的是就绪可读写事件。在每次感知到有事件发生（比如可读就绪事件）后，就需要应用进程主动调用 read 方法来完成数据的读取，也就是要应用进程主动将 socket 接收缓存中的数据读到应用进程内存中，这个过程是同步的，读取完数据后应用进程才能处理数据。
Proactor 是异步网络模式，感知的是已完成的读写事件。在发起异步读写请求时，需要传入数据缓冲区的地址（用来存放结果数据）等信息，这样系统内核才可以自动帮我们把数据的读写工作完成，这里的读写工作全程由操作系统来做，并不需要像 Reactor 那样还需要应用进程主动发起 read/write 来读写数据，操作系统完成读写工作后，就会通知应用进程直接处理数据。
因此，Reactor 可以理解为「来了事件操作系统通知应用进程，让应用进程来处理」，而 Proactor 可以理解为「来了事件操作系统来处理，处理完再通知应用进程」。这里的「事件」就是有新连接、有数据可读、有数据可写的这些 I/O 事件这里的「处理」包含从驱动读取到内核以及从内核读取到用户空间。

举个实际生活中的例子，Reactor 模式就是快递员在楼下，给你打电话告诉你快递到你家小区了，你需要自己下楼来拿快递。而在 Proactor 模式下，快递员直接将快递送到你家门口，然后通知你。

无论是 Reactor，还是 Proactor，都是一种基于「事件分发」的网络编程模式，区别在于 Reactor 模式是基于「待完成」的 I/O 事件，而 Proactor 模式则是基于「已完成」的 I/O 事件。

UPUP小亮

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
高性能网络模式：Reactor 的原理与思考

Reactor 模式和 Proactor 模式都是处理并发 I/O 事件的设计模式。它们各自的核心思想是将 I/O 操作与实际处理逻辑解耦。本文将详细介绍高性能网络模式**：Reactor 和 Proactor 的原理**，并通过 C++ 代码示例来展示它们的实现。我们将深入探讨这两种模式的优缺点，以及如何在实际项目中应用它们。Proactor模式是一种基于事件驱动的网络编程模式。
复制链接

扫一扫