Java IO 全攻略---之一

Java IO

       本篇主要讲述IO相关的内容,主要包括:与IO相关的简单的历史背景知识;Java IO的简单分类;与IO设计相关的两个模式;同时列举几个简单的例子;分析其中几个实现的源代码;最后给大家一些简单扩展的例子。治学先治史,下面我们先从简单的历史开始吧!

 

一、      历史背景

       “对语言设计人员来说,创建好的输入/输出系统是一项特别困难的任务。

――Think in Java

       无论是系统、还是语言的设计中IO的设计都是异常复杂的。面临的最大的挑战一般是如何覆盖所有可能的因素,我们不仅仅要考虑文件、控制台、网络、内存等不同的种类,而且要处理大量的不同的读取方式,如:顺序读取、随机读取,二进制读取、字符读取,按行读取、按字符读取……

       Linux是第一个将设备抽象为文件的操作系统,在Linux中所有的外部设备都可以用读取文件的方法读取,这样编程人员就可以以操作文件的方法操作任何设备。C++IO方面也做了一些改进――引进了流的概念,我们可以通过cincout读写一些对象。Java语言在IO设计方面取得较大的成功,它是完全面向对象的,主要采用装饰器模式避免大量的类,包括了最大的可能性,提供了较好的扩展机制……

       Java库的设计者通过创建大量类来攻克这个难题。事实上,JavaIO系统采用了如此多的类,以致刚开始会产生不知从何处入手的感觉(具有讽刺意味的是,JavaIO设计初衷实际要求避免过多的类)。” 上面一段来自《Think in Java》,确实很多初学者刚刚学习javaIO时会比较茫然,不过等我们知道装饰器模式(Decorator)的用意、场景及其在JavaIO包中的使用,你可能会真正领会整个IOFrameWork

二、IO的分类

    Java IO一般包含两个部分:1.java.io包中堵塞型IO;2.java.nio包中的非堵塞型IO,通常称为New IO。学过操作系统的朋友都知道系统运行的瓶颈一般在于IO操作,一般打开某个IO通道需要大量的时间,同时端口中不一定就有足够的数据,这样read方法就一直等待读取此端口的内容,从而浪费大量的系统资源。有人也许会提出使用java的多线程技术啊!但是在当前进程中创建线程也是要花费一定的时间和系统资源的,因此不一定可取。Java New IO的非堵塞技术主要采用了Observer模式,就是有一个具体的观察者和=监测IO端口,如果有数据进入就会立即通知相应的应用程序。这样我们就避免建立多个线程,同时也避免了read等待的时间。不过本篇主要讲述java的堵塞型IO,就是我们通常应用的那个包。

    打开你的java.io包你可以看到Java的IO包含大量的类和接口(JDK1.6中包含83个类或者接口),如此众多的类和接口似乎无从下手。下面就将IO简单地分类。Java的IO主要包含三个部分:1.流式部分――IO的主体部分;2.非流式部分――主要包含一些辅助流式部分的类,如:File类、RandomAccessFile类和FileDescriptor等类;3.文件读取部分的与安全相关的类,如:SerializablePermission类。以及与本地操作系统相关的文件系统的类,如:FileSystem类和Win32FileSystem类和WinNTFileSystem类。

       流式部分可以概括为:两个对应一个桥梁。两个对应指:1.字节流(Byte Stream)和字符流(Char Stream)的对应;2.输入和输出的对应。一个桥梁指:从字节流到字符流的桥梁。对应于输入和输出为InputStreamReaderOutputStreamWriter

       在流的具体类中又可以具体分为:1.介质流(Media Stream或者称为原始流Raw Stream)――主要指一些基本的流,他们主要是从具体的介质上,如:文件、内存缓冲区(Byte数组、Char数组、StringBuffer对象)等,读取数据;2.过滤流(Filter Stream)――主要指所有FilterInputStream/FilterOutputStreamFilterReader/FilterWriter的子类,主要是对其包装的类进行某些特定的处理,如:缓存等。

 

三、IO中的流

       流具有最基本的特点:“One dimension , one direction . 即流是一维的,同时流是单向的。关于维和我们通常说的一维长度,二维平面,三维空间,四维时空……是同一个概念,流就是一维的。单向就是只可以一个方向(按顺序从头至尾依次)读取,不可以读到某个位置,再返回前面某个位置。流的概念和实际水流的概念基本一致,水只可以从高向低一个方向流动。我们某时在目地喝了一口水,下次在同一个地点喝水已经不是当时的那片水了。

       流的这种特性在JMSJava Message Service)的API设计中得到了体现。JMSJ2EE平台下面向消息中间件的一个标准。(关于中间件技术有机会和大家探讨)JMS中有五种具体类型的消息,这些消息一般分为两类:1.流式的消息――包含ByteMessageStreamMessage2.非流式的消息――包含TextMessageObjectMessageMapMessage。我们在明白IO中流的特点后,基本可以明白JMS API设计者的意图。

       可能有些场合我们需要在文件中随机插入数据、在流中来来回回地执行某些操作,这时候我们绝对不可以使用流相关的对象。很幸运JDK的设计者为我们设计了一个单独的类RandomAccessFile,它可以完成打开、关闭文件、以基本数据类型的方式读取数据、读取下一个行、以UTF等格式读取数据、写入各种类型的数据、比较特殊的是他可以通过文件指针的seek方法让文件指针移到某个位置,可以通过getFilePointer()方法得到当前指针的位置、可以通过length()方法得到当前文件的容量、通过getFD()得到FileDescriptor对象,通过getChannel()方法得到FileChannel对象,从而和New IO整合。

       下面比较简单的分析IO中的各个对象吧!

3.1 IO中的输入字节流

       下面是IO中输入字节流的继承图。

o        InputStream

o        ByteArrayInputStream

o        FileInputStream

o        FilterInputStream

o        BufferedInputStream

o        DataInputStream

o        LineNumberInputStream

o        PushbackInputStream

o        ObjectInputStream

o        PipedInputStream

o        SequenceInputStream

o        StringBufferInputStream

在上面的关系图中可以看出:1.InputStream是所有的输入字节流的父类,它是一个抽象类。2. ByteArrayInputStreamStringBufferInputStreamFileInputStream是三种基本的介质流,它们分别将Byte数组、StringBuffer、和本地文件中读取数据。PipedInputStream是从与其它线程共用的管道中读取数据,与Piped相关的知识会用专门的一小节讲解。3. ObjectInputStream和所有FilterInputStream的子类都是装饰流(装饰器模式的主角)。下表列出了这些流的功能及如何使用它们(具体使用在讲解完装饰器模式后会举几个例子)。

基本输入字节流:

功能

如何构造

怎样使用

ByteArrayInputStream

将内存中的Byte数组适配为一个InputStream

从内存中的Byte数组创建该对象(2种方法)

一般作为数据源,会使用其它装饰流提供额外的功能,一般都建议加个缓冲功能。

StringBufferInputStream

将内存中的字符串适配为一个InputStream

从一个String对象创建该对象。底层的实现使用StringBuffer。该类被Deprecated。主要原因是StringBuffer不应该属于字节流,所以推荐使用StringReader

一般作为数据源,同样会使用其它装饰器提供额外的功能。

FileInputStream

最基本的文件输入流。主要用于从文件中读取信息。

通过一个代表文件路径的StringFile对象或者FileDescriptor对象创建。

一般作为数据源,同样会使用其它装饰器提供额外的功能。

PipedInputStream

读取从对应PipedOutputStream写入的数据。在流中实现了管道的概念。

利用对应的PipedOutputStream创建。

在多线程程序中作为数据源,同样会使用其它装饰器提供额外的功能。

SequenceInputStream

2个或者多个InputStream对象转变为一个InputStream.

使用两个InputStream 或者内部对象为InputStreamEnumeration对象创建该对象。

一般作为数据源,同样会使用其它装饰器提供额外的功能。

FilterInputStream

给其它被装饰对象提供额外功能的抽象类

主要子类见下表

 

装饰、输入字节流:

功能

如何构造

怎样使用

DataInputStream

一般和DataOutputStream配对使用,完成基本数据类型的读写。

利用一个InputStream构造。

提供了大量的读取基本数据类新的读取方法。

BufferedInputStream

使用该对象阻止每次读取一个字节都会频繁操作IO。将字节读取一个缓存区,从缓存区读取。

利用一个InputStream、或者带上一个自定义的缓存区的大小构造。

使用InputStream的方法读取,只是背后多一个缓存的功能。设计模式中透明装饰器的应用。

LineNumberInputStream

跟踪输入流中的行号。可以调用getLineNumber( )setLineNumber(int)方法得到和设置行号。

利用一个InputStream构造。

紧紧增加一个行号。可以象使用其它InputStream一样使用。

PushbackInputStream

可以在读取最后一个byte后将其放回到缓存中。

利用一个InputStream构造。

一般仅仅会在设计compilerscanner 时会用到这个类。在我们的java语言的编译器中使用它。很多程序员可能一辈子都不需要。

3.2 IO中的输出字节流

       下面是IO中输出字节流的继承图。

    • OutputStream
      • ByteArrayOutputStream
      • FileOutputStream
      • FilterOutputStream
        • BufferedOutputStream
        • DataOutputStream
        • PrintStream
      • ObjectOutputStream
      • PipedOutputStream

在上面的关系图中可以看出:1.OutputStream是所有的输出字节流的父类,它是一个抽象类。2. ByteArrayOutputStreamFileOutputStream是两种基本的介质流,它们分别向Byte数组、和本地文件中写入数据。PipedOutputStream是向与其它线程共用的管道中写入数据, 3. ObjectOutputStream和所有FilterOutputStream的子类都是装饰流。下表列出了输出字节流的功能及如何使用它们。

功能

如何构造

怎样使用

ByteArrayOutputStream

在内存中创建一个buffer。所有写入此流中的数据都被放入到此buffer中。

无参或者使用一个可选的初始化buffer的大小的参数构造。

一般将其和FilterOutputStream套接得到额外的功能。建议首先和BufferedOutputStream套接实现缓冲功能。通过toByteArray方法可以得到流中的数据。(不通明装饰器的用法)

FileOutputStream

将信息写入文件中。

使用代表文件路径的StringFile对象或者FileDescriptor对象创建。还可以加一个代表写入的方式是否为append的标记。

一般将其和FilterOutputStream套接得到额外的功能。

PipedOutputStream

任何写入此对象的信息都被放入对应PipedInputStream 对象的缓存中,从而完成线程的通信,实现了“管道”的概念。具体在后面详细讲解。

利用PipedInputStream构造

在多线程程序中数据的目的地的。一般将其和FilterOutputStream套接得到额外的功能。

FilterOutputStream

实现装饰器功能的抽象类。为其它OutputStream对象增加额外的功能。

见下表

见下表

       装饰输出字节流:

功能

如何构造

怎样使用

DataOutputStream

通常和DataInputStream配合使用,使用它可以写入基本数据类新。

使用OutputStream构造

包含大量的写入基本数据类型的方法。

PrintStream

产生具有格式的输出信息。(一般地在java程序中DataOutputStream用于数据的存储,即J2EE中持久层完成的功能,PrintStream完成显示的功能,类似于J2EE中表现层的功能)

使用OutputStream和一个可选的表示缓存是否在每次换行时是否flush的标记构造。还提供很多和文件相关的构造方法。

一般是一个终极(“final”)的包装器,很多时候我们都使用它!

BufferedOutputStream

使用它可以避免频繁地向IO写入数据,数据一般都写入一个缓存区,在调用flush方法后会清空缓存、一次完成数据的写入。

从一个OutputStream或者和一个代表缓存区大小的可选参数构造。

提供和其它OutputStream一致的接口,只是内部提供一个缓存的功能。

 

3.3字节流的输入与输出的对应

       3.1节讲过输入与输出的对应,下图表示字节流部分的输入与输出的对应关系。 

 【引用】Java IO 全攻略---之一 - Hunter - 一生有你

 

       上图中蓝色的为主要的对应部分,红色的部分就是不对应部分。我习惯上称之为“不入流”部分。紫色的虚线部分代表这些流一般要搭配使用。从上面的图中可以看出Java IO中的字节流是极其对称的。

“存在及合理”我们看看这些字节流中不太对称的几个类吧!

1.         LineNumberInputStream主要完成从流中读取数据时,会得到相应的行号,至于什么时候分行、在哪里分行是由改类主动确定的,并不是在原始中有这样一个行号。在输出部分没有对应的部分,我们完全可以自己建立一个LineNumberOutputStream,在最初写入时会有一个基准的行号,以后每次遇到换行时会在下一行添加一个行号,看起来也是可以的。好像更不入流了。

2.         PushbackInputStream的功能是查看最后一个字节,不满意就放入缓冲区。主要用在编译器的语法、词法分析部分。输出部分的BufferedOutputStream几乎实现相近的功能。

3.         StringBufferInputStream已经被Deprecated,本身就不应该出现在InputStream部分,主要因为String应该属于字符流的范围。已经被废弃了,当然输出部分也没有必要需要它了!还允许它存在只是为了保持版本的向下兼容而已。

4.         SequenceInputStream可以认为是一个工具类,将两个或者多个输入流当成一个输入流依次读取。完全可以从IO包中去除,还完全不影响IO包的结构,却让其更“纯洁”――纯洁的Decorator模式。

5.         PrintStream也可以认为是一个辅助工具。主要可以向其他输出流,或者FileInputStream写入数据,本身内部实现还是带缓冲的。本质上是对其它流的综合运用的一个工具而已。一样可以踢出IO包!System.outSystem.out就是PrintStream的实例!

蓝色的部分是IO字节流的主要组成部分,存在极强的对称关系。关于搭配使用的三对类补充一下:ObjectInputStream/ObjectOutputStreamDataInputStream/DataOutputStream主要是要求写对象/数据和读对象/数据的次序要保持一致,否则轻则不能得到正确的数据,重则抛出异常(一般会如此)PipedInputStream/PipedOutputStream在创建时一般就一起创建,调用它们的读写方法时会检查对方是否存在,或者关闭!道理极其简单――对方都不在了,怎么交互啊!

 


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值