1、NIO介绍
应用程序中,通常会涉及两种类型的计算:计算密集型和I/O密集型。对多数应用来说,花费在等待IO上的时间是比较大的。因此提高IO操作效率对应用的性能至关重要。
面向流的IO系统一次处理一个字节的数据,效率低。
New I/O提供高速、面向块的I/O处理机制,每个操作都产生或消费一个数据块, 按块处理数据比按字节处理数据快得多,只不过处理上少了一点优雅性。
NIO库在java.nio包中,java.io也以NIO为基础重新实现。
NIO中核心是通道和缓冲区,绝大部分操作都需要使用它们。
从一个通道中读取数据:创建缓冲区,通道将数据读取到缓冲区。
写入:创建缓冲区用数据填充,然后将缓冲区数据写入通道。
2、通道Channel
通道是NIO操作的数据操作连接,一旦打开通道,就可以执行读取和写入操作。与流相比,通道的操作使用Buffer对象而不是数组。
通道提高了IO操作性能,体现在文件和网络操作上。
通道是对原有IO包中流的模拟,任何来源和去向的数据都必须通过通道对象来读取或写入。
与流相比,通道是双向的,操作也是双向的,而且可以比流更反映底层操作系统的真实情况。
重要通道有4个:
FileChannel,从文件中读取数据。
DatagramChannel,通过UDP读写网络中的数据。
SocketChannel,通过TCP读写网络中的数据。
ServerSocketChannel,监听新接入的TCP连接,并创建一个SocketChannel。
3、文件通道
FileChannel是连接文件的通道,它无法设置为非阻塞模式,即总是工作在阻塞模式下。
BIO 即阻塞 I/O,不管是磁盘 I/O 还是网络 I/O,数据在写入 OutputStream 或者从 InputStream 读取时都有可能会阻塞。一旦有线程阻塞将会失去 CPU 的使用权,这在当前的大规模访问量和有性能要求情况下是不能接受的。
在使用FileChannel前,必须先打开它。但是程序无法直接创建FileChannel对象,需要通过InputStream、OutputStream或RandomAccessFile来获取FileChannel实例。
FileChannel提供了与其他通道之间高效传输数据的能力,比传统的基于流和字节数组作为缓冲的做法,实现起来更加简单快捷。
碰到的问题:FileChannel是抽象类,抽象类不能实例化是指不能直接通过new来进行实例化。但是如果抽象类通过其它函数获得了一个实例,那肯定是这个函数返回了这个抽象类的一个子类!!!还有就是,抽象类是有构造函数的,子类可以调用。
文件通道的另一个功能是对文件的部分片段进行加锁。
当文件上的某个片段上加排他锁后,其他进程必须等待锁释放之后,才能访问该文件的加锁片段。文件通道上的锁是由JVM所持有的,因此适合于与其他应用程序协同访问文件的情况。
4、缓冲区
抽象类Buffer及其实现类可以方便地用来创造各种基本数据类型的缓冲区,相对于流式IO中的数组缓冲区,Buffer提供了更加丰富的方法对其中的数据进行操作。
Buffer代表要写入或者刚读出的数据。NIO中,所有数据都通过缓冲区Buffer对象来处理。
缓冲区实质上是一个容器,发送给通道的所有数据必须先放入缓冲区;同样,从通道中读取的任何数据都要读到缓冲区。
从实现的结构看,缓冲区是一个数组,通常是一个字节数组,但是也可以是其他数组。值得注意的是,缓冲区又不仅仅是数组,缓冲区提供了对数据的结构化访问,而且还可以跟踪系统的读/写进程。
最常用的是ByteBuffer,它在其底层字节数组上进行get和set操作。每一种基本数据类型都有对应的缓冲区类型。除了ByteBuffer,子类的操作是完全一样,只是处理的数据类型不同。
使用Buffer读写数据的一般步骤:
装入数据到Buffer;(写)
调用flip()方法,将Buffer从写模式切换到读模式;
从Buffer中读取数据;
调用clear()方法或者compact()方法,清空。
flip()方法的作用是切换模式。
compact()方法只会清楚已经读过的数据,任何未读的数据都被移到缓冲区的起始处,新写入的数据将放到缓冲区未读数据的后面。
5、容量、位置和读写范围
从实现结构上看,缓冲区是一个数组,通常是一个字节数组,也可以使用其他类型的数组。
而本质上,缓冲区是一块可以写入数据,然后从中读取数据的内存,这块内存被包装成Buffer对象,并提供一组方法来访问内存。
6、分散和聚集
分散读:从通道中读取的数据写入多个Buffer,一次填充满每个缓冲区噢!
聚集写:把数据从多个缓冲区中写入通道,把一组缓冲区汇聚成单个数据流。
(多个Buffer保存在缓冲区数组中)
分散和聚集常用于需要将传输的数据分开处理的场合。例如传输由一个消息头和消息体组成的消息,可以将消息头和消息体分散到不同的Buffer中,方便分开进行处理。
7、编码与字符集
Java.nio.charset提供了相关类,可以对编码和解码过程进行精细的控制。
语言的多样性使得字符需要通过特定的字符集编码,字符集中每个字符会有一个证书编码与其对应。同一个字符集有不同的编码方式,如果某种编码格式产生的字节序列,用另外一种编码格式来解码,就会得到错误的字符,产生乱码!!
8、通道间的数据传输
transferForm(fromChannel, position, count)方法可以将数据从源通道直接传入本通道,从position处开始向目标文件写入数据,count为最多传输的字节数。
transferTo将数据从本通道传输到其他通道,该方法可以实现文件的复制。