Java NIO(New IO)
传统IO是面向字节流或字符流,并且是单向流。传统IO中,发送端与接收端依靠各自的Socket完成数据传输,实质上是Socket间的IO。NIO面向缓冲buffer,基于通道channel。通道(连接传输)和缓冲(储存)都是双向的,能更高效的输入输出。
Buffer缓冲:可以存储不同类型的数据。
常见Buffer:ByteBuffer, CharBuffer, DoubleBuffer, FloatBuffer, IntBuffer, LongBuffer, ShortBuffer。通过调用allocate( )分配缓冲区。
常用函数:get( )从缓冲中读数据, put( )向缓冲中写数据, rewind( ), flip( ), clear( ), mark( ), reset( )。其他函数的功能请参见下文。
属性:capacity, limit(limit后的数据不可操作),position(正在操作的位置,position ≤ limit ≤ capacity )。
在写入数据时,position和limit同时后移。由写变读(由读变写)时,要调用flip( )使position回到buffer的起始位置,此时limit作为结尾。然后可以通过get( )读取buffer中的数据。读完成后,position来到limit,使用rewind( )可以重复读。通过clear( )清空缓冲区,使limit回到buffer的起始位置。实际上,此时buffer中的数据依然存在,只是被遗忘了。使用mark( )标记position的位置,再由reset( )返回被mark( )标记的位置。
直接缓冲区与非直接缓冲区
- 直接缓冲由allocateDirect( )分配在OS内存上。直接缓冲更加高效,但分配与回收成本更高,同时存在安全风险。整个生命周期由OS控制。
- 非直接缓冲区通过调用allocate( )分配在JVM内存上。由于JVM中的数据也都来自OS内存的复制,相较于直接缓冲多了一次复制,所以性能比直接缓冲低。
通道
通道负责源节点与目标节点的连接。通道本身无法储存数据,必须配合缓冲完成传输。
常见通道:FileChannel(阻塞式),SocketChannel,ServerSocketChannel, DatagramChannel。
获取通道的方式:
- 通过传统IO(FileInputStream,FileOutputStream,RandomAccessFile。Socket,ServerSocket,DatagramSocket)调用getChannel( )获取通道;
- 调用各通道类的静态open( );
- Files.getByteChannel( )。
基本模型
入通道以buffer为单位从数据源读,即inputChannel.read(buf)。
出通道将buffer中的数据写入目标,即outputChannel.write(buf)。
例如,完成文件复制可以通过以下三种方式:
- 非直接缓冲区完成文件复制。原文件->输入通道->缓冲->输出通道->目标文件。
- 直接缓冲区完成文件复制(内存映射文件):可以直接对缓冲区进行操作,无需通道,内存写磁盘的过程无法控制。
- 通道间传输:transferTo( ), transferFrom( )均使用直接缓冲区,不再需要声明缓冲区。可以直接将输出通道的数据写到输出通道。
NIO的网络非阻塞通信
传统IO出现的阻塞问题,可以通过多线程解决。NIO中使用了选择器,选择器中注册了所有的通道(ServerSocketChannel和SocketChannel)。并且由选择器监控通道的状态,只有当特定事件发生,如数据就绪,选择器才会分配线程处理。
TCP阻塞式传输文件:
- 客户端:通过FileChannel读入文件;通过SocketChannel传输文件数据;ByteBuffer。
- 服务器端:通过ServerSocketChannel监听端口并建立SocketChannel;通过SocketChannel接收文件数据;通过FileChannel将接收到的文件写入硬盘;ByteBuffer。与传统IO一样,客户端需要关闭输出通道才能结束服务器端的阻塞状态,否则服务器端会一直等待客户端发送数据。
服务端回执:服务器端通过SocketChannel发送回执;客户端通过SocketChannel接收回执。
非阻塞式TCP:重点理解选择器Selector
- 客户端将SocketChannel设置为非阻塞。
- 服务端声明选择器,并由选择器监控通道的特殊状态,如Read读,Write写,Connection连接,Accept接收。
- 设置ServerSocketChannel为非阻塞。
- 选择器首先监听ServerSocketChannel的Accept状态。
- 当Accept发生时,再由ServerSocketChannel获取SocketChannel。选择器监听SocketChannel的Read状态。设置SocketChannel为非阻塞。
- 当Read发生时,才真正接收数据。
UDP的非阻塞
- 发送端:DatagramChannel。通道设置为非阻塞。每次DatagramChannel发送数据时再指定目标IP和端口。
- 接收端:DatagramChannel监听端口。通道置为非阻塞。Selector监听DatagramChannel的Read事件。