这里写目录标题
13.2 二进制文件和字节流
本节介绍在Java中如何以二进制字节的方式来处理文件,前面我们 提到Java中有流的概念,以二进制方式读写的主要流有:
·InputStream/OutputStream:这是基类,它们是抽象类。
·FileInputStream/FileOutputStream:输入源和输出目标是文件的流。
·ByteArrayInputStream/ByteArrayOutputStream:输入源和输出目标 是字节数组的流。
·DataInputStream/DataOutputStream:装饰类,按基本类型和字符串 而非只是字节读写流。
·BufferedInputStream/BufferedOutputStream:装饰类,对输入输出流提供缓冲功能。
下面,我们就来介绍这些类的功能、用法、原理和使用场景,最后 总结一些简单的实用方法。
13.2.1 InputStream/OutputStream
我们分别看下InputStream和OutputStream。
1.InputStream
(1)InputStream的基本方法
InputStream是抽象类,主要方法是:
read方法从流中读取下一个字节,返回类型为int,但取值为0~255,当读到流结尾的时候,返回值为-1,如果流中没有数据,read方法 会阻塞直到数据到来、流关闭或异常出现。异常出现时,read方法抛出 异常,类型为IOException,这是一个受检异常,调用者必须进行处理。 read是一个抽象方法,具体子类必须实现,FileInputStream会调用本地 方法。所谓本地方法,一般不是用Java写的,大多使用C语言实现,具 体实现往往与虚拟机和操作系统有关。
InputStream还有如下方法,可以一次读取多个字节:
读入的字节放入参数数组b中,第一个字节存入b[0],第二个存入 b[1],以此类推,一次最多读入的字节个数为数组b的长度,但实际读入 的个数可能小于数组长度,返回值为实际读入的字节个数。如果刚开始 读取时已到流结尾,则返回-1;否则,只要数组长度大于0,该方法都 会尽力至少读取一个字节,如果流中一个字节都没有,它会阻塞,异常 出现时也是抛出IOException。该方法不是抽象方法,InputStream有一个 默认实现,主要就是循环调用读一个字节的read方法,但子类如 FileInputStream往往会提供更为高效的实现。
批量读取还有一个更为通用的重载方法:
读入的第一个字节放入b[off],最多读取len个字节,read(byte b[])就是调用了该方法:
流读取结束后,应该关闭,以释放相关资源,关闭方法为:
不管read方法是否抛出了异常,都应该调用close方法,所以close方 法通常应该放在finally语句内。close方法自己可能也会抛出 IOException,但通常可以捕获并忽略。
(2)InputStream的高级方法
InputStream还定义了如下方法:
skip跳过输入流中n个字节,因为输入流中剩余的字节个数可能不到 n,所以返回值为实际略过的字节个数。InputStream的默认实现就是尽 力读取n个字节并扔掉,子类往往会提供更为高效的实现, FileInputStream会调用本地方法。在处理数据时,对于不感兴趣的部 分,skip往往比读取然后扔掉的效率要高。
available返回下一次不需要阻塞就能读取到的大概字节个数。 InputStream的默认实现是返回0,子类会根据具体情况返回适当的值, FileInputStream会调用本地方法。在文件读写中,这个方法一般没什么 用,但在从网络读取数据时,可以根据该方法的返回值在网络有足够数 据时才读,以避免阻塞。
一般的流读取都是一次性的,且只能往前读,不能往后读,但有时 可能希望能够先看一下后面的内容,根据情况再重新读取。比如,处理 一个未知的二进制文件,我们不确定它的类型,但可能可以通过流的前 几十个字节判断出来,判读出来后,再重置到流开头,交给相应类型的 代码进行处理。
InputStream定义了三个方法:mark、reset、markSupported,用于支 持从读过的流中重复读取。怎么重复读取呢?先使用mark()方法将当 前位置标记下来,在读取了一些字节,希望重新从标记位置读时,调用 reset方法。能够重复读取不代表能够回到任意的标记位置,mark方法有 一个参数readLimit,表示在设置了标记后,能够继续往后读的最多字节 数,如果超过了,