使用缓冲区Buffered流复制文件,文件变大的问题

public static void main(String[] args) throws IOException {
    
        File file = new File("D:\\aaa\\原文件.PDF");
        String fileName = "D:\\aaa\\复制的文件";
        
        for(int i=0;i < 10; i++){
    
//            FileUtils.copyFile(file, new File(fileName + i + ".PDF"));
    
            BufferedReader reader = new BufferedReader(new FileReader(file));
            BufferedWriter writer = new BufferedWriter(new FileWriter(new File(fileName + i + ".PDF")));
            String  data = null;
            while((data = reader.readLine()) != null){
                writer.write(data);
                writer.newLine();
                writer.flush();
            }
            writer.close();
            reader.close();
    
//            BufferedInputStream input = new BufferedInputStream(new FileInputStream(file));
//            BufferedOutputStream output = new BufferedOutputStream(
//                    new FileOutputStream(new File(fileName + i + ".PDF")));
//
//            int len = -1;
//            byte[] data = new byte [1024];//一次读取1M
//            while ((len = input.read(data)) != -1){
//                output.write(data,0,len);
//            }
//
//            output.close();
//            input.close();
            System.out.println("复制了第:" + i + " 个文件");
        }
    
        System.out.println("复制完成!");
    }

 

复制后的效果如下图:

   可以发现,复制后的文件大小和原文件是不一样的,这里是因为我复制的是PDF文件,而不是普通的文本文件,所以这里不能使用字符流BufferedReader,而应该使用字节流inputStream

下面总结一下字节流与字符流的区别与各自的使用场景:

  • Java 中的字节流处理的最基本单位为 1 个字节,通常用来处理二进制数据。字节流类 InputStream 和 OutputStream 类均为抽象类,代表了基本的输入字节流和输出字节流。
  • Java 中的字符流处理的最基本的单元是 Unicode 代码单元(大小2字节),通常用来处理文本数据。

区别:

  • 字节流操作的基本单元是字节;字符流操作的基本单元是字符
  • 字节流默认不使用缓冲区;字符流使用缓冲区
  • 字节流通常用于处理二进制数据,不支持直接读写字符;字符流通常用于处理文本数据
  • 在读写文件需要对文本内容进行处理:按行处理、比较特定字符的时候一般会选择字符流;仅仅读写文件,不处理内容,一般选择字节流

特征:

  • 以 stream 结尾都是字节流,reader 和 writer 结尾是字符流
  • InputStream 是所有字节输入流的父类,OutputStream 是所有字节输出流的父类
  • Reader 是字符输入流的父类,Writer 是字符输出流的父类

常见的字节流:

  • 文件流:FileOutputStream 和 FileInputStream
  • 缓冲流:BufferedOutputStream 和 BufferedInputStream
  • 对象流:ObjectOutputStream 和 ObjectInputStream

常见的字符流:

  • 字节转字符流:InputStreamReader 和 OutputStreamWriter
  • 缓冲字符流:PrintWriter 和 BufferedReader

可以这样理解文件复制的过程:
  字符流:二进制数据 --编码-> 字符编码表 --解码-> 二进制数据
  字节流:二进制数据 —> 二进制数据

  所以问题就是出现在编码和解码的过程中,既然是字符的编码表,那它就是包含所有的字符,但是字符的数量是有限的,这就意味着它不能表示一些超过编码表的字符,因为根本不存在表中。所以,JVM 会使用一些字符进行替换,基本上都是乱码(所以大小会发生变化),而且如果有一个数据恰好是-1,那么读取就会中断,引起数据丢失。

原文链接:https://www.cnblogs.com/zhangzhiyong-/p/15846765.html

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值