Java学习笔记19——深入学习FileInputStream流read方法

在Java程序中,数据的输入输出都是以“流”(Stream)方式进行的。JDK提供了java.io.*包,包中提供了许多接口和类,用于处理不同数据类型的输入输出。

学习FileInputStream流read方法,需要熟悉如下概念:

  • java.io包中提供了处理文件的File类,用于对文件进行所有的操作:建立、读取、删除、重命名,建立、删除文件夹等。
  • 继承自InputStream抽象类的流,都是向程序中输入数据,且数据的单位是字节(8位),继承自OutputStream抽象类的流,都是程序输出数据,且数据的单位是字节(8位)。
  • 继承自Reader抽象类的流,都是向程序中输入数据,且数据的单位是字符(16位),继承自Writer抽象类的流,都是程序输出数据,且数据的单位是字符(16位)。
  • 节点流直接连接数据源,它可以从一个特定的数据源(节点)读写数据。例如文件、内存等。常用的节点流有FileInputStream、FileOutputStream、FileReader、FileWriter等。

FileInputStream主要用来处理字节文件,它们是InputStream的子类,实现了父类的抽象方法。FileInputStreanm用来读取字节文件,通过打开一个到实际文件的连接来创建一个FileInputStrem类对象,构造方法如下:

public FileInputStream (String name) throw FileNotFoundException   //name :文件的路径

public FileInputStream (File file) throw FileNotFoundException   // 通过File类创建的文件的对象

下面是通过一段代码较深入地学习FileInputStream的read()方法。

import java.io.*;

public class FileInputStreamTest {
    public static void main(String[] args){
        FileInputStream fis = null;   // 使用FileInputStream类,声明文件读取对象,创建变量fis
        File f = null;                // 使用File类,声明一个文件对象,创建变量f

        try{
            // 通过File类的构造方法指定文件的路径
            f = new File(System.getProperty("user.dir"),"/src/SystemTest.java"); 
            // 通过FileInputStream的构造函数中传入指定的文件路径对象f,文件字节流对象fis将直接连接到数据源(文件SystemTest.java)
            fis = new FileInputStream(f);       
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        }

        int end = 0;                               // 获取读取的字节
        byte[] by = new byte[(int)f.length()];     // 创建读取内容的字节数组变量by,大小为所读取文件的长度
        System.out.println("----按字节读取");
        
        /*
        通过文件字节输入流FileInputStream类提供的read(byte[] by)方法,读取文件SystemTest.java中的f.length个字节的内容,
        存放在字节数据by中,再创建指定缓冲区内容的字符串s,然后以字符串的形式输出到控制台。
        调用read方法可能抛出IOException异常,需要在程序中捕获进行处理。最后关闭文件时,也可能抛出IOException异常,也须进行捕获处理。
         */
        try{
            while ((end=fis.read(by)) != -1) {   // 读取f.length个字节,放入到字节数组by中
                String s = new String(by);       // 创建有字节数组by指定缓冲区内容的字符串s
                System.out.println(s);
                System.out.println("一共读取了:" + end + "个字节。");
            }
        }catch (IOException e) {
            System.out.println("读取数据错误。");
            System.exit(-1);
        }
        System.out.println("----读取数据结束----");

        if (fis != null) {
            try{
                fis.close();
            }catch (IOException e){
                System.out.println("文件关闭异常");
                System.exit(-1);
            }
        }
    }
}

需要深入思考及了解的是:

(1)上面代码中数组变量by的长度指定了是文件的长度(f.lenght()),为何还有while循环判断d的意义是什么?有必要吗?

在上面的代码中,虽然by数组的大小被初始化为文件的长度,但是FileInputStreamread(byte[] b)方法并不保证一次性读取整个文件。实际上,它尝试读取一定数量的字节到数组中,但具体读取的字节数取决于底层操作系统的缓冲区大小以及文件系统中可用的数据。

因此,while循环的目的是确保从FileInputStream中读取所有的数据,直到没有更多的数据可读(即read()方法返回-1)。

这里有几个关键点:

  1. 按块读取FileInputStream通常不会一次性将整个文件加载到内存中,特别是当文件很大时。相反,它会分块读取数据,每次读取一部分。这是为了效率和资源管理的考虑。
  2. 返回读取的字节数read(byte[] b)方法返回实际读取的字节数,这可以少于请求的字节数(即b.length)。当到达文件的末尾时,它会返回-1
  3. 文件长度与实际读取:虽然数组by的大小是根据文件长度设置的,但read()方法并不保证一次性填充整个数组。实际上,如果文件很大,或者由于某些其他原因(如磁盘I/O、网络延迟等),可能需要多次调用read()方法来读取整个文件。

因此,while循环是必要的,以确保即使文件很大或读取过程中出现问题,代码也能正确读取整个文件的内容。如果没有这个循环,代码可能只会读取文件的一部分,或者在第一次read()调用后停止,即使还有更多数据需要读取。

(2)上述代码,如果读取的文件比较大,一次性没有读取完,那么while循环体内代码是不是会循环执行多次?

如果读取的文件比较大,无法一次性读取完整,while循环体内的代码会循环执行多次。这是因为FileInputStreamread(byte[] b)方法会分批次读取文件内容,每次读取的字节数取决于文件系统中可用的数据量和底层操作系统的I/O操作。

在每次循环中,fis.read(by)会尝试读取更多的字节到by数组中,并返回实际读取的字节数。这个返回值被赋给end变量,并且如果这个返回值不是-1(表示文件末尾),循环就会继续执行。

循环体内的代码:

String s = new String(by); // 创建有字节数组by指定缓冲区内容的字符串s
System.out.println(s);
System.out.println("一共读取了:" + end + "个字节。");

将会多次执行,每次处理上一次调用read()方法读取到的字节。这里有一个需要注意的地方:

String s = new String(by);

这行代码将整个by数组转换为一个字符串。但是,由于read()方法可能并没有填充整个数组(尤其是在循环的最后一次迭代时),直接使用整个数组来创建字符串可能会导致字符串包含未初始化的字节(通常是0值),这可能会导致输出包含不可见或不可预测的字符。

更正确的做法是只处理实际读取到的字节。这可以通过创建一个新的字符串,其只包含by数组中前end个元素来实现:

String s = new String(by, 0, end);

此外,如果文件非常大,将整个文件内容转换为字符串可能会导致内存溢出。在实际应用中,处理大文件时通常会采用流式处理,即一次处理文件的一小部分,而不是试图一次性将整个文件加载到内存中。

所以,如果文件比较大,上述代码中的while循环会循环多次,每次处理文件的一部分,直到整个文件被读取完毕或遇到I/O错误为止。

(3)假如读取的文件非常大,while循环体内代码将多次执行,关于while 循环体内创建的字符串对象变量s会怎样哪?

while循环体内,每次迭代都会创建一个新的字符串对象s。这是因为每次循环时都会执行String s = new String(by, 0, end);

每次调用new String(by, 0, end);都会在内存中分配一个新的字符串对象,并用by数组中前end个字节的内容来初始化它。因此,每次循环都会有一个新的s对象,它与之前循环中创建的s对象是不同的。

在循环结束后,前一个s对象(以及它在堆上占用的内存)将不再被引用,因此它可能会成为垃圾回收的目标(具体取决于Java的垃圾回收机制和当前的内存状态)。但是,重要的是要注意,如果文件非常大,并且循环次数非常多,这可能会导致大量的字符串对象被创建和销毁,这可能对垃圾回收器造成压力,并可能影响程序的性能。

  • 15
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Java IO学习总结 Java操作有关的类或接口: Java类图结构: 的概念和作用 是一组有顺序的,有起点和终点的字节集合,是对数据传输的总称或抽象。即数据在两设备间的传输称为的本质是数据传输,根据数据传输特性将抽象为各种类,方便更直观的进行数据操作。 IO的分类 根据处理数据类型的不同分为:字符和字节 根据数据向不同分为:输入和输出 字符和字节 字符的由来: 因为数据编码的不同,而有了对字符进行高效操作的对象。本质其实就是基于字节读取时,去查了指定的码表。 字节和字符的区别: 读写单位不同:字节以字节(8bit)为单位,字符以字符为单位,根据码表映射字符,一次可能读多个字节。 处理对象不同:字节能处理所有类型的数据(如图片、avi等),而字符只能处理字符类型的数据。 结论:只要是处理纯文本数据,就优先考虑使用字符。 除此之外都使用字节。 输入和输出 对输入只能进行读操作,对输出只能进行写操作,程序中需要根据待传输数据的不同特性而使用不同的Java IO对象 1.输入字节InputStreamIO 中输入字节的继承图可见上图,可以看出: InputStream 是所有的输入字节的父类,它是一个抽象类。 ByteArrayInputStream、StringBufferInputStream、FileInputStream 是三种基本的介质,它们分别从Byte 数组、StringBuffer、和本地文件中读取数据。PipedInputStream 是从与其它线程共用的管道中读取数据,与Piped 相关的知识后续单独介绍。 ObjectInputStream 和所有FilterInputStream 的子类都是装饰(装饰器模式的主角)。 2.输出字节OutputStream IO 中输出字节的继承图可见上图,可以看出: OutputStream 是所有的输出字节的父类,它是一个抽象类。 ByteArrayOutputStream、FileOutputStream 是两种基本的介质,它们分别向Byte 数组、和本地文件中写入数据。PipedOutputStream 是向与其它线程共用的管道中写入数据, ObjectOutputStream 和所有FilterOutputStream 的子类都是装饰。 3.字节的输入与输出的对应 图中蓝色的为主要的对应部分,红色的部分就是不对应部分。紫色的虚线部分代表这些一般要搭配使用。从上面的图中可以看出Java IO 中的字节是极其对称的。“存在及合理”我们看看这些字节中不太对称的几个类吧! LineNumberInputStream 主要完成从中读取数据时,会得到相应的行号,至于什么时候分行、在哪里分行是由改类主动确定的,并不是在原始中有这样一个行号。在输出部分没有对应的部分,我们完全可以自己建立一个LineNumberOutputStream,在最初写入时会有一个基准的行号,以后每次遇到换行时会在下一行添加一个行号,看起来也是可以的。好像更不入了。 PushbackInputStream 的功能是查看最后一个字节,不满意就放入缓冲区。主要用在编译器的语法、词法分析部分。输出部分的BufferedOutputStream 几乎实现相近的功能。 StringBufferInputStream 已经被Deprecated,本身就不应该出现在InputStream 部分,主要因为String 应该属于字符的范围。已经被废弃了,当然输出部分也没有必要需要它了!还允许它存在只是为了保持版本的向下兼容而已。 SequenceInputStream 可以认为是一个工具类,将两个或者多个输入当成一个输入依次读取。完全可以从IO 包中去除,还完全不影响IO 包的结构,却让其更“纯洁”――纯洁的Decorator 模式。 PrintStream 也可以认为是一个辅助工具。主要可以向其他输出,或者FileInputStream 写入数据,本身内部实现还是带缓冲的。本质上是对其它的综合运用的一个工具而已。一样可以踢出IO 包!System.out 和System.out 就是PrintStream 的实例! 4.字符输入Reader 在上面的继承关系图中可以看出: Reader 是所有的输入字符的父类,它是一个抽象类。 CharReader、StringReader 是两种基本的介质,它们分别将Char 数组、String中读取数据。PipedReader 是从与其它线程共用的管道中读取数据。 BufferedReader 很明显就是一个装饰器,它和其子类负责装饰其它Reader 对象。 FilterReader 是所有自定义具体装饰的父类,其子类PushbackReader 对Reader 对象进行装饰,会增加一个行号。 InputStreamReader 是一个连接字节和字符的桥梁,它将字节转变为字符。FileReader 可以说是一个达到此功能、常用的工具类,在其源代码中明显使用了将FileInputStream 转变为Reader 的方法。我们可以从这个类中得到一定的技巧。Reader 中各个类的用途和使用方法基本和InputStream 中的类使用一致。后面会有Reader 与InputStream 的对应关系。 5.字符输出Writer 在上面的关系图中可以看出: Writer 是所有的输出字符的父类,它是一个抽象类。 CharArrayWriter、StringWriter 是两种基本的介质,它们分别向Char 数组、String 中写入数据。PipedWriter 是向与其它线程共用的管道中写入数据, BufferedWriter 是一个装饰器为Writer 提供缓冲功能。 PrintWriter 和PrintStream 极其类似,功能和使用也非常相似。 OutputStreamWriter 是OutputStream 到Writer 转换的桥梁,它的子类FileWriter 其实就是一个实现此功能的具体类(具体可以研究一SourceCode)。功能和使用和OutputStream 极其类似,后面会有它们的对应图。 6.字符的输入与输出的对应 7.字符与字节转换 转换的特点: 其是字符和字节之间的桥梁 可对读取到的字节数据经过指定编码转换成字符 可对读取到的字符数据经过指定编码转换成字节 何时使用转换? 当字节和字符之间有转换动作时; 操作的数据需要编码或解码时。 具体的对象体现: InputStreamReader:字节到字符的桥梁 OutputStreamWriter:字符到字节的桥梁 这两个对象是字符体系中的成员,它们有转换作用,本身又是字符,所以在构造的时候需要传入字节对象进来。 8.File类 File类是对文件系统中文件以及文件夹进行封装的对象,可以通过对象的思想来操作文件和文件夹。 File类保存文件或目录的各种元数据信息,包括文件名、文件长度、最后修改时间、是否可读、获取当前文件的路径名,判断指定文件是否存在、获得当前目录中的文件列表,创建、删除文件和目录等方法。 9.RandomAccessFile类 该对象并不是体系中的一员,其封装了字节,同时还封装了一个缓冲区(字符数组),通过内部的指针来操作字符数组中的数据。 该对象特点: 该对象只能操作文件,所以构造函数接收两种类型的参数:a.字符串文件路径;b.File对象。 该对象既可以对文件进行读操作,也能进行写操作,在进行对象实例化时可指定操作模式(r,rw) 注意:该对象在实例化时,如果要操作的文件不存在,会自动创建;如果文件存在,写数据未指定位置,会从头开始写,即覆盖原有的内容。 可以用于多线程下载或多个线程同时写数据到文件。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值