在Java IO类库中主要分两类,一类面向字节(byte[]),一类面向字符(char,String)。
1.面向字节类
面向字节类的超类就是InputStream/OutputStream, 显然这两个类被设计为抽象类。下面以InputSream及其派生类来总结面向字节IO类。OutputStream分支和InputStream对称。
Java的IO类库是一个典型的装饰器模式(java类库中还有Collection的一些同步版本(Collectons.synchronizedXXX)和不可变版本(Collections.unmodifiableXXX)也是使用的装饰器模式)。
看一下InputStream类分支的结构图:
Java的IO类库是一个典型的装饰器模式(java类库中还有Collection的一些同步版本(Collectons.synchronizedXXX)和不可变版本(Collections.unmodifiableXXX)也是使用的装饰器模式)。
看一下InputStream类分支的结构图:
java.io.InputStream (implements java.io.Closeable)
|--java.io.ByteArrayInputStream
|--java.io.FileInputStream
|--java.io.FilterInputStream
|--java.io.BufferedInputStream
|--java.io.DataInputStream (implements java.io.DataInput)
|--java.io.LineNumberInputStream
|--java.io.PushbackInputStream
|--java.io.ObjectInputStream (implements java.io.ObjectInput, java.io.ObjectStreamConstants)
|--java.io.PipedInputStream
|--java.io.SequenceInputStream
|--java.io.StringBufferInputStream
其中抽象类FilrerInputStream就是装饰器的抽象接口类。使用IO类需要程序员自己根据需求使用装饰器模式进行组装。
2.面向字符类
面向字符类的超类就是Reader/Writer,这两个类也是抽象类。下面以Reader类来总结面向字符IO类。Writer分支与Reader分支对称。
Reader也是一个装饰器模式,不过没有InputStream类那么复杂,FilterReader之下只有一个子类PushbackReader,也不常用。另外一个作为装饰类的就是很常用的BufferedReader。
看一下Reader类分支的结构图:
Reader也是一个装饰器模式,不过没有InputStream类那么复杂,FilterReader之下只有一个子类PushbackReader,也不常用。另外一个作为装饰类的就是很常用的BufferedReader。
看一下Reader类分支的结构图:
java.io.Reader (implements java.io.Closeable, java.lang.Readable)
|--java.io.BufferedReader
|--java.io.LineNumberReader
|--java.io.CharArrayReader
|--java.io.FilterReader
|--java.io.PushbackReader
|--java.io.InputStreamReader
|--java.io.FileReader
|--java.io.PipedReader
|--java.io.StringReader
其中很有特点的一个类就是InputStreamReader,其构造函数为:
InputStreamReader (InputStream in)
//创建一个使用默认字符集的 InputStreamReader。
InputStreamReader (InputStream in, Charset cs)
//创建使用给定字符集cs的 InputStreamReader。
InputStreamReader (InputStream in, CharsetDecoder dec)
//创建使用给定字符集解码器dec的 InputStreamReader。
InputStreamReader (InputStream in, String charsetName)
//创建使用指定字符集charsetName的 InputStreamReader。
可以指定编码方式或者解码器,如果不指定就使用系统默认的编码方式。
另外其子类FileReader的构造函数摘要为:
FileReader (File file)
FileReader (FileDescriptor fd)
FileReader (String fileName)
可以看出FileReader的创建就是直接用文件映射,所以FileReader无法指定字符集。因此可以看出,InputStreamReader是连接自己与字符之间唯一的桥梁。
如果需要指定字符集(在处理中文的时候经常用到(utf-8))必须使用InputStreamReader。
3.总结
1.由面向字节还是面向字符选择流的不同分支面向字节用InputStream/OutputStream,面向字符用Reader/Writer。
2.一般情况下缓冲流会带来效率的提升,所以使用流的时候用缓冲流进行包装
File file = new File ("hello.txt");
FileReader fileReader=new FileReader(file);
BufferedReader bufReader=new BufferedReader(fileReader);
3.当需要指定字符集的时候必须使用字节到字符的桥梁:InputStreamReader
例:
最近用java处理中文文件的时候遇到了乱码的问题。代码如下:
private static void initSet() throws Exception{
File oldString = new File("const_string.html");
FileReader frOldString = new FileReader(oldString);
BufferedReader br = new BufferedReader(frOldString);
String string = null;
while((string=br.readLine())!=null){
cStrings.add(string);
System.out.println(string);
}
br.close();
}
如果文件const_string.html中有中文字符,那么就会出现乱码(由此也可以看出文件里面存的就是字节,关键看如何解码)。此时如果需要指定编码格式的话
就需要将
FileReader frOldString = new FileReader(oldString);
改为
InputStreamReader frOldString = new InputStreamReader(new FileInputStream(oldString),"utf-8");
注意:InputStReader并未直接由文件构造而是由InputStream(及其子类)构造。