前言
Java NIO有两种解释:
- 一种是非阻塞IO(Non-blocking I/O)
- 一种是新的IO(New I/O)
其实两种概念也是相同的
一、概述
Java NIO是从Java1.4版本开始引入的一个新的IO API,可以代替标准的IO API。
NIO与原来的IO有同样的作用和目的,但是使用的方式完全不同,NIO支持面向缓冲区的,基于通道的IO操作。NIO将以更加高效的方式进行文件的读写操作。
NIO有三大核心部分
- Channel(通道)
- Buffer(缓冲区)
- Selector(选择器)
二、Java中IO模型
Java中共支持3中网络IO模型:BIO,NIO,AIO。
- BIO:
同步并阻塞(传统的阻塞型),服务器实现模式为一个连接一个线程,就是客户端发送连接请求时候,服务器端就需要启动一个线程进行处理,如果这个连接不做任何事情就会造成不必要的线程开销,比如socket阻塞在 accept 等待连接。
BIO可以通过多线程的方式来改善并发性能,不过底层还是一个线程对应一个连接。
- NIO
同步非阻塞的I/O模型,也是I/O多路复用的基础,服务器实现模式为一个线程处理多个请求(连接),就是客户端发送的连接请求都会注册到多路复用器上,多路复用器轮训到连接有I/O请求就进行处理。NIO现在已经被越来越多地应用到大型应用服务器,成为解决高并发与大量连接、I/O处理问题的有效方式。
Netty目前是基于NIO模型来实现的。
- AIO(NIO.2):
异步非阻塞,AIO引入异步通道的概念,采用了Proactor模式,简化了程序的编写,有效的请求才启动线程,它的特点是先由操作系统完成后才通知服务端程序启动线程去处理,一般适用于连接数较多而且连接世界比较长的应用。
Java NIO与BIO的区别
- BIO以流的方式处理数据,而NIO以块的方式处理数据,块IO的效率比流IO高很多;
- BIO是阻塞的,NIO则是非阻塞的;
- BIO基于字节流和字符流进行操作,而NIO基于Channel(通道)和Buffer(缓冲区)进行操作,数据总是从通道读取到缓冲区中,或者从缓冲区写入到通道中。Selector(选择器)用于监听多个通道的事件(比如:连接请求,数据到达等),因此使用单个线程就可以监听多个客户端通道;
- BIO是单向的,如:InputStream, OutputStream;而NIO是双向的,既可以用来进行读操作,又可以用来进行写操作。
BIO,NIO,AIO适用场景:
- BIO方式适用于连接数比较小且固定的架构,这种方式对服务器资源要求比较高,并发局限的应用中,JDK1.4以前是唯一的选择,但程序简单容易理解。
- NIO方式适用于连接数目较多且连接比较短的架构,比如聊天服务器(长连接),弹幕系统,服务器间通讯,编程比较复杂,从JDK1.4开始支持。
- AIO方式适用于连接数目较多且连接比较长的重操作的架构,比如相册服务器,充分调用OS参与并发的操作,编程比较复杂,从JDK7开始支持。
三、NIO三大核心原理
Buffer(缓冲区)
缓冲区本质上是一块可以写入数据,然后可以从中读取数据的内存,这块内存被包装成NIO Buffer对象,并提供了一组方法,用来方便的访问该块内存,相比较直接对数组的操作,Buffer API更加容易操作和管理。
Channel(通道)
Java NIO的通道类似流,但又有些不同: 既可以从通道中读取数据,又可以写数据到通道。但流的(input或output)读写通常是单向的。通道可以非阻塞读取和写入通道,也可以支持读取或写入缓冲区,同时支持异步地读写。
常见的Channel有
- FileChannel
- DatagramChannel
- SocketChannel
- ServerSocketChannel
Selector(选择器)
Selector是一个Java NIO组件,可以能够检查一个或多个NIO通道,并确定哪些通道已经准备好进行读取或写入。一个单独的线程可以管理多个channel,从而管理多个网络连接。
- 每个Channel都会对应一个Buffer
- 一个线程对应Selector,一个Selector对应多个Channel(连接)
- 程序切换到那个Channel是由事件决定的
- Selector会根据不同的事件,在各个通道上切换
- Buffer就是一个内存块,底层是一个数组
- 数据的读取写入是通过Buffer完成的,BIO中要么是输入流,或者是输出流,不能双向,但是NIO的Buffer时可以读也可以写
- Channel负责传输,Buffer负责存取数据
四、缓冲区Buffer
一个用于特定基本数据类型的容器。由 Java NIO包定义的,所有缓冲区都是Buffer抽象类的子类。Java NIO中的Buffer主要用于与NIO通道进行交互,数据是从通道读入缓冲区,从缓冲区写入通道中的
Buffer类及其子类
Buffer就像一个数组,可以保存多个相同类型的数据。根据数据类型不同,有以下Buffer常用子类:
- ByteBuffer
- MappedByteBuffer
- DirectByteBuffer
- HeapByteBuffer
- ShortBuffer
- IntBuffer
- LongBuffer
- FloatBuffer
- DoubleBuffer
- CharBuffer
上述Buffer类 他们都采用相似的方法进行管理数据,只是各自管理的数据类型不同而已。都是通过如下方法获取一个Buffer对象:
//创建一个容量为capacity的xxxBuffer对象
static xxxBuffer allocate(int capacity);
...
IntBuffer buffer = IntBuffer.allocate(10);
Buffer中的重要概念
- 容量(capacity):创建后不能更改,且容量不能为负;
- 限制(limit):表示缓冲区中可以操作数据的大小。缓冲区的限制不能为负,并且不能大于其容量;写入模式,限制等于buffer的容量。读取模式下,limit等于写入的数据量;
- 位置(position):下一个要读取或写入的数据的索引。缓冲区的位置不能为负,并且不能大于其限制;
- 标记(mark)与重置(reset):标记是一个索引,通过Buffer中的mark()方法指定Buffer中一个特定的position,之后可以通过调用reset()方法恢复到这个position。