在学习JAVA的时候,被I/O整蒙了,一个重要的原因是数量多的不同类,却完成相似的功能。另外一个是同样的目的可以由多种方式来实现,根本还是和类的设计有关。
近日,在网上看到一篇文章,清晰的梳理了Java I/O设计思路,个人认为很棒。
1. stream代表一种数据流,具体是输入还是输出,使用哪个类,首先需要看功能,其次要注意使用的类的名字,最后代码细节。
2. 对于类的使用,主要区分是InputStream OR OutputStream。
一种区分方法:这里的主体是CPU,如果需要获得数据到内存中(比如从文件),就要使用InputStream/Reader的相关类。反之,使用OutputStream/Writer的相关类。
任何有能力接收数据源(流)的javaio对象我们就可以看作是一个OutputStream对象。
3. 对于细节,要注意根据需要使用封装的类(嵌套)。在就是要注意关闭,一般都要写到finally中。
java.io包中的类非常繁多,但其实只要归成4类:InputStream
& OutputStream
、Reader
& Writer
,由于功能和命名上都相当接近,因此只要掌握了其中一种,将会很容易理解其他3种。
横向归类:InputStream
& OutputStream
(字节流)、Reader
& Writer
(字符流).
纵向归类:InputStream
作为父类,其子类的角色和作用,并以此举一反三。
字节流
字节(byte)是计算机中基本数据单位,一切的计算机数据(或“文件”)都是由或多或少的字节组成,因此使用字节流,理论上可以处理一切计算机数据(文件),包括图像、音频、文本等。
然而对于文本数据,由于存在编码问题比较麻烦,所以交由字符流处理。
字符流
1char=2byte,字符(char)的表示范围(2^16)是字节(byte)表示范围(2^8)的2^8=256倍。专门用于处理文本数据。
历史
字节流在Java的初版(jdk 1.0)已经存在,字符流在jdk 1.1中加入,以替代字节流中处理字符的功能。
装饰者模式
私以为,提到Java I/O的话,不能不提装饰者模式。
装饰者模式就是在一个主体(被装饰者)的外部使用装饰类来进行装饰,对主体的行为根据不同的装饰者类进行不同的修改。单个的装饰类自根据自身特点对主体的行为进行部分改进,因此可以组合多个装饰类来对主体进行修改(在代码中表现为多层装饰类的嵌套)。
Java的I/O类设计应用了装饰者模式。单个的流对象主体,例如InputStream
的直接子类(Direct Subclasses)中,分别面向文件FileInputStream
、内存ByteArrayInputStream
、线程PipedInputStream
,而InputStream
的另一个直接子类FileterInputStream
为装饰类(的父类),分别定义了各种具体的装饰类(如BufferedInputStream
、DataInputStream
等)。
如图:
从代码的角度来看:DataInputStream
、BufferedInputStream
为装饰者,FileInputStream
为主体(被装饰者)
InputStream in = new DataInputStream(new BufferedInputStream(new FileInputStream(new File(src))));
装饰者模式从抽象的角度来说很容易理解,然而也存在一个很明显的缺点:装饰类过多。因此我们能看到java.io包中那么多的类。如果没有理解装饰者模式,即使有一定经验的Java developer也会感到混乱。
结论
- 处理非文本数据使用字节流;
- 处理具体的文本数据使用字符流;
例如对于文件复制这样的操作来说,即使是文本文件的复制,我们对其具体的内容是什么并不关心,因此可以直接使用字节流。但当我们要从一个文本文件中读取内容,我们关心其具体的内容,所以使用字符流。
Description 详细内容
篇幅所限,只列出常用的类,其余部分可参考Java API手册。
继承关系图
字节流的继承关系
OutputStream
- OutputStream
- ByteArrayOutputSteam:将数据输出到字节数组(byte array)中,也就是内存,不用生成文件;
- FileOutputStream:将数据输出到具体的文件;
- PipedOutputStream:将数据输出到线程,即通过与PipedInputStream联合使用,将数据在不同的线程之间传递;
- FilterOutputStream:装饰类的父类
- BufferedOutputStream:使用了缓冲区,调用flush()才会清空缓冲区将数据写入文件。与普通OutputStream相比,由于不用频繁地与文件进行I/O数据传输(内存与磁盘之间,这将消耗大部分性能),而是在每次调用flush()时一次性地将一块数据在内存与磁盘中传输,因此会性能将得到提升(有NIO的影子);
- DataOutputStream:用于方便地传输基础类型的数据,因此除了传统的write()外,还有一堆writeInt()、writeDouble、writeBoolean()等;
- PrintStream:InputStream本来是适合用于非文本的二进制文件(如图片、声音文件等),而PrintStream则是在字节流中专门用于打印文本内容;
InputStream
- InputStream
- ByteArrayInputStream:从内存中读取数据;
- FileInputStream:从文件中读取数据;
- PipedInputStream:从一个线程中读取数据,从另一个线程中输出(PipedOutputStream),同一线程下使用者两个对象可能会造成线程死锁;
- SequenceInputStream:将两个
InputStream
合并成一个; - FilterInputStream:装饰类的父类;
- BufferedInputStream:使用了缓冲区,参考
BufferedOutputStream
; - DataInputStream:方便地读取基本类型的数据,因此除了基础的read()外,还有一堆readChar()、readDouble()、readInt()等;
- BufferedInputStream:使用了缓冲区,参考
字符流的继承关系
Writer
- BufferedWriter:缓冲区;
- CharArrayWriter:面向内存;
- PipedWriter:面向线程;
- PrintWriter:方便输出,特别是按格式输出printf();
- StringWriter:使用StringBuilder来存放内容;
- OutputStreamWriter:用于字符流与字节流之间的转换;
- FileWriter:面向文件
- FilterWriter:装饰类
Reader
- BufferedReader:缓冲区;
- CharArrayReader:面向内存;
- PipedReader:面向线程;
- InputStreamReader:用于字符流与字节流之间的转换;
- FileReader:面向文件
- FilterReader