1. Netty概述
虽然Java已经提供了NIO,但原生NIO仍存在部分问题:
- NIO的类库和API繁杂,使用麻烦。需要熟练掌握Selector、ServerSocketChannel、SocketChannel、ByteBuffer等
- 需要具备其他的额外技能:要熟悉Java多线程编程,因为NIO编程涉及到Reactor模式,必须对对多线程和网络编程非常熟悉,才能编写出高质量的NIO程序
- 开发工作量和难度都非常大:例如客户端面临断连重连、网络闪断、半包读写、失败缓存、网络拥塞和异常流的处理等等
- JDK NIO的Bug:例如臭名昭著的Epoll Bug,它会导致Selector空轮询,最终导致CPU 100%。知道JDK 1.7 版本该问题仍旧存在,没有被根本解决
Netty官网(https://netty.io/)说明:
Netty is a NIO client server framework which enables quick and easy development of network applications such as protocol servers and clients
再次回顾Netty的特点:
- Netty是由JBOSS提供的一个Java开源框架。Netty提供异步、基于事件驱动的网络应用程序框架,用以快速开发高性能、高可靠的网络IO程序
- Netty可以帮助你快速、简单地开发出一个网络应用,相当于简化和流程化了NIO的开发过程
- Netty是目前最流行的NIO框架,在互联网领域、大数据分布式计算领域、游戏行业、通信行业等获得了广泛的应用,知名的Elasticsearch、Dubbo框架内部都采用了Netty
1.1. Netty的优点
Netty对JDK自带的NIO的API进行了封装,解决了上述问题。
- 设计优雅:适用于各种传输类型的统一API阻塞和非阻塞Socket;基于灵活且可扩展的事件模型,可以清晰地分离关注点;高度可定制的线程模型 – 单线程,一个或多个线程池
- 使用方便:详细记录的Javadoc,用户指南和示例;没有其他依赖项,JDK 5(Netty 3.x)或 6(Netty 4.x)就足够了
- 高性能、吞吐量更高:延迟更低;减少资源消耗:最小化不必要的内存复制
- 安全:完整的SSL/TLS和StartTLS支持
- 社区活跃、不断更新:社区活跃,版本迭代周期短,发现的Bug可以被及时修复,同时,更多的新功能会被加入
1.2. Netty版本
Netty版本分为netty3.x、netty4.x、netty5.x。因为netty5.x出现了重大bug,所以被官方废弃了,目前推荐使用的是netty4.x的稳定版本。
下载地址:
https://netty.io/downloads.html
2. 线程模型基本介绍
对不同的线程模式,对程序的性能有很大影响,为了搞清Netty线程模式,我们系统地讲解下各个线程模式,看看Netty线程模型有什么优越性。
目前存在的线程模型有:
- 传统阻塞I/O服务模型
- Reactor模式
根据Reactor的数量和处理资源池线程的数量不同,有3种典型的实现:
- 单Reactor单线程
- 单Reactor多线程
- 主从Reactor多线程
Netty线程模式主要基于主从Reactor多线程模型做了一定的改进,其中主从Reactor多线程模型有多个Reactor
2.1. 传统阻塞I/O服务模型
如下所示:
黄色表示对象,蓝色表示线程,白色表示方法。
模型特点:
- 采用的是阻塞I/O模型,获取输入数据
- 每个连接都需要独立的线程完成数据的输入、业务处理、数据返回
模型问题:
- 当并发数很大时,会创建大量的线程,占用大量系统资源
- 连接创建后,如果当前线程暂时没有数据可读,该线程会阻塞在read操作,造成线程资源浪费
2.2. Reactor模式
针对传统阻塞I/O服务模型的2个缺点,解决方案:
- 基于I/O复用模型:多个连接共用一个阻塞对象,应用程序只需要在一个阻塞对象等待,无需阻塞等待所有连接。当某个连接有新的数据可以处理时,操作系统通知应用程序,线程从阻塞状态返回,开始进行业务处理
- 基于线程池复用线程资源:不必再为每个连接创建线程,将连接完成后的业务处理任务分配给线程进行处理,一个线程可以处理多个连接的业务
Reactor模式也叫反应器模式、分发者模式(Dispatcher)、通知者模式(Notifier)
此图的说明:
- Reactor模式:通过一个或多个输入同时传递给服务处理器的模式(基于事件驱动)
- 服务器端程序处理传入的多个请求,并将它们同步分派到相应的处理现场,因此Reactor模式也叫Dispatcher模式
- Reactor模式使用IO复用监听事件,收到事件后,分发给某个线程(进程),这就是网络服务器高并发处理的关键
3. Reactor 模式详述
根据Reactor的数量和处理资源池线程的数量不同,有3种典型的实现:
- 单Reactor单线程
- 单Reactor多线程
- 主从Reactor多线程:是Netty基于的模式
3.1. 单Reactor单线程
如下图所示:
方案说明:
- select 是前面I/O复用模型介绍的标准网络编程API,可以实现应用程序通过一个阻塞对象监听多路连接请求
- Reactor对象通过Select监控客户端请求事件,收到事件后通过Dispatch进行分发
- 如果是建立连接请求事件,则由Acceptor通过Accept处理连接请求,然后创建一个Handler对象处理连接完成后的后续业务处理
- 如果不是建立连接事件,则Reactor会分发调用连接对应的Handler来响应
- Handler会完成Read -> 业务处理 -> Send的完整业务流程
服务端用1个线程通过多路复用搞定所有的IO操作(包括连接、读、写等),编码简单,清晰明了。但是如果客户端连接数量较多,将无法支撑。
单Reactor单线程优缺点:
- 优点:模型简单,没有多线程、进程通信、竞争的问题,全部都在一个线程中完成
- 缺点:性能问题,只有1个线程,无法完全发挥多核CPU的性能。Handler在处理某个连接上的业务时,整个进程无法处理其他连接事件,很容易导致性能瓶颈
- 缺点:可靠性问题,线程意外终止,或是进入死循环,会导致整个系统通信模块不可用,不能接受和处理外部消息,造成节点故障
- 使用场景:客户端的数量有限,业务处理非常快速
3.2. 单Reactor多线程
如下图所示:
方案说明:
- Reactor对象通过select 监控客户端请求事件,收到事件后,通过dispatch进行分发
- 如果是建立连接请求,则由Acceptor 对象通过accept处理连接请求,然后创建一个Handler对象处理完成连接后的各种事件
- 如果不是连接请求,则由Reactor分发调用连接对应的handler来处理
- Handler只负责响应事件,不做具体的业务处理。通过read读取数据后,会分发给后面的worker线程池的某个线程处理业务
- Worker线程池会分配独立线程完成真正的业务,并将结果返回给handler
- Handler收到响应后,通过send将结果返回给client
单Reactor多线程优缺点:
- 优点:可以充分利用多核CPU的处理能力
- 缺点:多线程数据共享和访问比较复杂,reactor处理所有的事件的监听和响应,在单线程运行,在高并发场景会出现性能瓶颈
3.3. 主从Reactor多线程
针对单Reactor多线程模型中,Reactor在单线程中运行,高并发场景下容易成为性能瓶颈,可以让Reactor在多线程中运行。
方案说明:
- Reactor主线程MainReactor对象通过select监听连接事件,收到事件后,通过Acceptor处理连接事件
- 当Acceptor处理连接事件后,MainReactor将连接分配给SubReactor
- SubReactor将连接加入到连接队列进行监听,并创建Handler进行各种事件处理
- 当有新的事件发生时,subreactor就会调用对应的handler进行处理
- Handler通过read读取数据,分发给后面的worker线程进行处理
- Worker线程池会分配独立的worker线程进行业务处理并返回结果
- Handler收到响应的结果后,再通过send方法将结果返回给client
- Reactor主线程可以对应多个Reactor子线程,即MainReactor可以关联多个subReactor
需要注意的是,Reactor子线程并不是一个,而是多个。
在Scalable IO in Java 这本书中,对Multiple Reactors的原理图解为:
主从Reactor多线程方案优缺点说明:
- 优点:父线程与子线程的数据交互简单职责明确,父线程只需要接收新连接,子线程完成后续的业务处理
- 优点:父线程与子线程的数据交互简单,Reactor主线程只需要把新连接传给子线程,子线程无需返回数据
- 缺点:编程复杂度较高
结合实例:这种模型在许多项目中使用广泛,包括Nginx主从Reactor多进程模型,Memcached主从多线程,Netty主从多线程模型的支持。
3.4. Reactor模式小结
以生活案例来理解 Reactor模式:
- 单reactor单线程:前台接待员和服务员是同一个人,全程为顾客服务
- 单reactor多线程:1个前台接待员,多个服务员,接待员只负责接待
- 主从reactor多线程:多个前台接待员,多个服务生
Reactor模式具有以下优点:
- 响应快,不必为单个同步时间所阻塞,虽然Reactor本身依然是同步的
- 可以最大程度的避免复杂的多线程以及同步问题,并且避免了多线程/进程的切换开销
- 扩展性好:可以方便的通过增加Reactor实例个数来充分利用CPU资源
- 复用性好:Reactor模型本身与具体事件处理逻辑无关,具有很高的复用性
------------------------------------
此 Netty 笔记为学习尚硅谷韩老师讲的 Netty 整理完成,原视频讲解十分详细,建议对 Netty 框架感兴趣的同学们可以看一遍原视频:
https://www.bilibili.com/video/BV1DJ411m7NR