1.Java的I/O演进之路

最新推荐文章于 2024-03-22 17:20:26 发布

ning421479924

最新推荐文章于 2024-03-22 17:20:26 发布

阅读量525

点赞数

分类专栏： netty权威指南读书笔记文章标签： java io

本文链接：https://blog.csdn.net/ning421479924/article/details/72190301

版权

netty权威指南读书笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本章着重掌握如下2个知识点：

I/O基础入门
Java的I/O演进

I/O基础入门

介绍: Java1.4之前的早期版本，Java对I/O的支持并不完善，开发人员在开发高性能I/O程序的时候，会面临一些巨大的挑战和困难，主要问题如下。

没有数据缓冲区，I/O性能存在问题；
没有C或者C++中的Channel概念，只有输入和输出流；
同步阻塞式I/O通信（BIO），通常会导致通信线程被长时间阻塞；
支持的字符集有限，硬件可移植性不好。

在Java支持异步I/O之前的很长一段时间里，高性能服务端开发领域一直被C++和C长期占据，Java的同步阻塞I/O被大家所诟病。

Linux网络I/O模型简介

介绍: Linux的内核将所有外部设备都看做一个文件来操作，对一个文件的读写操作会调用内核提供的系统命令，返回一个file descriptor（fd, 文件描述符）。而对一个socket的读写也会有相应的描述符，成为socketfd（socket描述符），描述符就是一个数字，它指向内核中的一个结构体（文件路径，数据区等一些属性）。

根据UNIX网络编程对I/O模型的分类，UNIX提供了5种I/O模型，分别如下。

（1）阻塞I/O模型：最常用的I/O模型就是阻塞I/O模型，缺省情况下，所有文件操作都是阻塞的。我们以套接字接口为例来讲解此模型：在进程空间中调用recvfrom，其系统调用直到数据包到达且被复制到应用进程的缓冲区中或者发生错误才返回，在此期间一直会等待，进程在从调用recvfrom开始到它返回的整段时间内都是被阻塞的，因此被称为I/O模型。如下图所示。

这里写图片描述

（2）非阻塞I/O模型：recvfrom从应用层到内核的时候，如果该缓冲区没有数据的话，就直接返回一个EWOULDBLOCK错误，一般都对非阻塞I/O模型进行轮询检查这个状态，看内核是不是有数据来，如下图所示。

这里写图片描述

（3）I/O复用模型：Linux提供select/poll，进程通过将一个或多个fd传递给select或poll系统调用，阻塞在select操作上，这样select/poll可以帮助我们侦测多个fd是否处于就绪状态。select/poll是顺序扫描fd是否就绪，而且支持的fd数量有限，因此它的使用受到了一些制约。Linux还提供了一个epoll系统调用，epoll使用基于时间驱动方式代替顺序扫描，因此性能更高。当有fd就绪时，立即回调函数rollback。如下图所示。

这里写图片描述

（4）信号驱动I/O模型：首先开启套接口信号驱动I/O功能，并通过系统调用sigactio执行一个信号处理函数（此系统调用立即返回，进程继续工作，它是非阻塞的）。当数据准备就绪时，就为该进程生成一个SIGIO信号，通过信号回调通知应用程序调用recvfrom来读取数据，并通知主循环函数处理数据。如下图所示。
这里写图片描述

（5）异步I/O：告知内核启动某个操作，并让内核在整个操作完成后（包括将数据从内核复制到用户自己的缓冲区）通知我们。这种模型与信号驱动模型的主要区别是：信号驱动I/O由内核通知我们何时可以开始一个I/O操作；异步I/O模型由内核通知我们I/O操作何时已经完成，如下图所示。
这里写图片描述

PS: 如果想了解更多的UNIX系统网络编程知识，可以阅读《UNIX网络编程》，里面有非常详细的原理和API介绍。对于大多数Java程序员来说，不需要了解网络编程的底层细节，大家只需要有个概念，知道对于操作系统而言，底层是支持异步I/O通信的。只不过在很长一段时间Java并没有提供异步I/O通信的类库，导致很多原生的Java程序员对这块儿比较陌生。当了解了网络编程的基础后，理解Java的 NIO类库就会更加容易一些。

I/O多路复用技术

介绍: 在I/O编程过程中，当需要同时处理多个客户端接入请求时，可以利用多线程或者I/O多路复用技术进行处理。I/O多路复用技术通过把多个I/O的阻塞复用到同一个select的阻塞上，从而使得系统在单线程的情况下可以同时处理多个客户端请求。与传统的多线程/多进程模型比，I/O多路复用的最大优势是系统开销小，系统不需要创建新的额外进程或者线程，也不需要维护这些进程和线程的运行，降低了系统的维护工作量，节省了系统资源，I/O多路复用的主要应用场景如下。

服务器需要同时处理多个处于监听状态或者多个连接状态的套接字；
服务器需要同时处理多种网络协议的套接字。

目前支持I/O多路复用的系统调用有select、pselect、poll、epoll，在Linux网络编程过程中，很长一段时间都是用select做轮询和网络时间通知，然而select的一些固有缺陷导致了它的应用受到了很大的限制，最终Linux不得不在新的内核版本中寻找select的替代方案，最终选择了epoll。epoll与select的原理比较类似。为了克服select的缺点，epoll作了很多重大改进，总结如下：

1.支持一个进程打开的socket描述符（FD）不受限制（仅受限于操作系统的最大文件句柄数）。

select最大的缺陷就是单个进程锁所打开的FD是有一定限制的，它由FD_SETSIZE设置，默认值是1024。对于那些需要支持上万个TCP连接的大型服务器来说显然太少了。可以选择修改这个宏然后重新编译内核，不过这会带来网络效率的下降。我们也可以通过选择多进程的方案（传统的Apache方案）解决这个问题，不过虽然在Linux上创建进程的代价比较小，但仍旧是不可忽视的。另外，进程间的数据交换非常麻烦，对于Java来说，由于没有共享内存，需要通过Socket通信或者其他方式进行数据同步，这带来了额外的性能损耗，增加了程序复杂度，所以也不是一种完美的解决方案。值得庆幸的是，epoll并没有这个限制，它所支持的FD上限是操作系统的最大文件句柄数，这个数字远远大于1024。例如，在1GB内存的机器上大约是10万个句柄左右，具体的值可以通过cat/proc/sys/fs/file-max查看，通常情况下这个值跟系统的内存关系比较大。

2.I/O效率不会随着FD数目的增加而线性下降。

传统select/poll的另一个致命弱点，就是当你拥有了一个很大的socket集合时，由于网络延时或者链路空闲。任意时刻只有少部分的socket是”活跃”的，但是select/poll每次调用都会线性扫描全部的集合，导致效率呈现线性下降，epoll不存在这个问题，它只会对”活跃”的socket进行操作——这时因为在内核视线中，epoll是根据每个fd上面的callback函数实现的。那么，只有”活跃”的socket才会去主动调用callback函数，其他idle状态的socket则不会。在这点上，epoll实现了一个伪AIO。针对epoll和select性能对比的benchmark测试表明：如果所有的socket都处于活跃态——例如一个高速LAN环境，epoll并不比select/ppll效率高太多；相反，如果过多使用epoll_ctl，效率相比还有稍微地降低。但是一旦使用idle connections模拟WAN环境，epoll的效率就远在select/poll之上了。

3.使用mmap加速内核域用户空间的消息传递。

无论是select、poll还是epoll都需要内核把FD消息通知给用户空间，如何避免不必要的内存复制就显得非常重要，epoll是通过内核和用户空间mmap同一块内存来实现的。

4.epoll的API更加简单。

包括创建一个epoll描述符、添加监听事件、阻塞等待所监听的事件发生、关闭epoll描述符等。

PS：值得说明的是，用来客服select/poll缺点的方法不只有epoll，epoll只是一种Linux的实现方案在freeBSD下有kqueue，而dev/poll是最古老的Solaris的方案，使用难度依次递增。

Java的I/O演进

介绍: 在JDK1.4退出Java NIO之前，基于Java的所有Socket通信都采用了同步阻塞模式（BIO），这种一请求一应答的通信模型简化了上层的应用开发，但是在性能和可靠性方面却存在在巨大的瓶颈。因此，在很长的一段时间里，大型的应用服务器都采用C或者C++语言开发，因为它们可以直接使用操作系统提供的异步I/O或者AIO能力。当并发访问量增大、响应时间延迟增大之后，采用Java BIO开发的服务端软件只有通过硬件的不断扩容来满足高并发和低延时，它极大地增加了企业的成本，并且随着集群规模的不断膨胀，系统的可维护性也面临着巨大的挑战，只能通过采购性能更高的硬件服务器来解决问题，这会导致恶性循环。

Java的I/O发展简史

1.从JDK1.0到JDK1.3，Java的I/O类库都非常原始，很多UNIX网络编程中的概念或者借口在I/O类库中都没有实现，例如Pipe、Channel、Buffer和Selector等。

2.2002年发布JDK1.4时，NIO以JSR-51的身份正式随JDK发布。它新增了个java.nio包，提供了很多进行一步I/O开发的API和类库。

3.2011年7月28日，JDK1.7正式发布。它的一个比较大的亮点就是将原来的NIO类库进行了升级，被称为NIO2.0。NIO2.0有JSR-203演进而来。

ning421479924

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
1.Java的I/O演进之路

本章着重掌握如下2个知识点： I/O基础入门Java的I/O演进I/O基础入门介绍: Java1.4之前的早期版本，Java对I/O的支持并不完善，开发人员在开发高性能I/O程序的时候，会面临一些巨大的挑战和困难，主要问题如下。没有数据缓冲区，I/O性能存在问题；没有C或者C++中的Channel概念，只有输入和输出流；同步阻塞式I/O通信（BIO），通常会导致通信线程被长时间阻塞；支
复制链接

扫一扫

专栏目录