目前存在的线程模型有:
- 传统阻塞I/O服务模型
- Reactor 模式
根据Reactor的数量和处理资源线程池的数量不同,有三种典型的实现
- 单 Reactor 单线程
- 单 Reactor 多线程
- 主从 Reactor 多线程
Netty 线程模式(Netty 主要基于主从 Reactor 多线程模型做了一定的改进,其中主从 Reactor 多线程模型有多个 Reactor)
传统阻塞I/O服务模型
模型特点:
- 采用阻塞IO模式获取输入数据
- 每个连接读需要独立的线程完成数据的输入,业务处理,数据返回
问题分析:
- 当并发数很大的时候,就会创建大量的线程,这样就会占用系统很多的资源
- 连接创建后,如果当前线程暂时没有数据可读,该线程会组的在read操作。
Reactor 模式
IO复用结合线程池,就是Reactor模式的基本设计思想
说明:
- Reactor 模式,通过一个或多个输入同时传递给服务处理器的模式(基于事件驱动)
- 服务器端处理传入的多个请求,并将它们同步分派到相应的处理线程上,因此Reactor模式也叫Dispatcher 模式
- Reactor 模式使用IO复用监听事件,收到事件后,分发给某个线程(进程),这点就是网络服务高并发处理的关键
Reactor 模式核心组成:
- Reactor:Reactor 在一个单独的线程中运行,负责监听和分发事件,分发给适当的处理程序来对IO事件做出反应。
- Handlers:处理程序执行I/O事件要完成的实际事件。
一、Reactor模式-单线程模式
方案说明:
- Select 是前面IO复用模型介绍的标准网络编程API,可以实现应用通过一个阻塞对象监听多路连接请求
- Reactor 对象通过Select监控客户端请求事件,收到事件后通过Dispatch进行分发
- 如果建立连接请求事件,则有Acceptor通过Accept处理连接请求,然后创建一个Handler 对象处理连接完成后续业务流程
- 如果不是建立连接事件,则Reacotr会分发调用连接对应的Handler来响应
- Handler会完成Read -> 业务处理 -> send 的完整业务流程
方案优缺点说明:
- 优点
- 模型简单,没有多线程、进程通信、竞争问题,全部都在一个线程中完成
- 缺点
- 性能问题,只有一个线程,无法发挥多核CPU的性能,Handler在处理某个连接上的业务时,整个进程无法处理其他的连接事件,很容易导致性能瓶颈
- 可靠性问题,线程意外终止,或者进入死循环,会导致这个通信模块不可用,不能接收和处理外部消息,造成节点故障
- 使用场景
- 客户端数量有限,业务处理非常快
二、Reactor模式-工作者线程池模式
方案说明:
- Reactor 对象通过select 监控客户端请求事件,收到事件后,通过Dispatch进行分发
- 如果是建立连接的请求,则由Acceptor通过Accept处理连接请求,然后创建一个Handler对象处理连接后的各种事件
- 如果不是连接请求,则由Reactor 分发调用连接对应的Handler来处理
- handler只负责响应时间,不做具体的业务处理,通过read读取数据后,会分发给后面的worker线程池的某个线程处理业务
- worker线程池会分配一个独立的线程完成真正的业务,并将结果返回给Handler
- Handler 收到响应后,通过send将结果返回给client
方案优缺点说明:
- 优点
- 可以充分的利用多核CPU的处理能力
- 缺点
- 多线程数据共享和访问比较复杂,Reactor处理所有的事件监听和响应,在单线程运行,在高并发场景会出现性能瓶颈
三、Reactor模式-多线程模式
方案说明:
- Reactor主线程MainReactor对象通过select监听连接事件,收到事件后,通过Acceptor处理连接事件
- 当Acceptor处理连接事件后,MainReactor将连接分配给SubReactor
- SubReactor将连接加入到连接队列进行监听,并创建Handler进行各种事件处理
- 当有新的事件发生,SubReactor就会调用对应的Handler处理
- Handler通过read读取数据,分发给后面的worker线程处理
- worker线程池分配独立的worker线程进行处理,并返回结果
- handler收到响应结果后,再通过send将结果返回给client
- Reactor主线程可以对应多个Reactor子线程,即MainReactor可以关联多个SubReactor
方案优缺点说明:
- 优点
- 父线程与子线程的数据交互简单职责明确,父线程只负责接收新连接,子线程完成后续的业务处理
- 父线程与子线程的数据交互简单,Reactor主线程只需要把新连接传给子线程,子线程无需返回数据
- 缺点
- 编程复杂度较高