使用ByteArrayOutputStream解决输出乱码问题

最新推荐文章于 2024-08-22 11:11:18 发布

DanceDonkey

最新推荐文章于 2024-08-22 11:11:18 发布

阅读量9.6k

点赞数 1

分类专栏： Java 文章标签： java io

本文链接：https://blog.csdn.net/qq_43750656/article/details/120926673

版权

Java 专栏收录该内容

61 篇文章 0 订阅

订阅专栏

本文探讨了在Java中使用字节流读取UTF-8编码文件时可能出现的乱码问题。通过示例代码展示，当字节数组长度不合适时，如何导致编码错误。解决方案是利用ByteArrayOutputStream，它能自动扩容，确保正确读取所有字节。最终，文章强调了指定文件编码的重要性，以避免编码混乱。

摘要由CSDN通过智能技术生成

先来看一段看似没问题的代码

在这里插入图片描述这是一个使用utf-8编码的文本内容,下面使用输入流读取文件内容，打印到控制台。

        FileInputStream is = new FileInputStream("C:\\Users\\Administrator\\Desktop\\char.txt");
        byte[] bytes = new byte[1024];
        int read = is.read(bytes);
        while (read != -1){
            System.out.println(new String(bytes,0,read));
            read = is.read(bytes);
        }
        is.close();

运行结果：
这看似没有问题的运行，实则潜藏着巨大隐患。

utf-8编码在存储中文字符的时候，一个中文字符会分配3或4个字节。那我整个文件有5个字符，最大也就只占20个字节，我创建了一个1024字节的数组，那肯定是一次性就能读完的，没有问题。但当我把字节数组的长度该为5时，此时，只能一次读取5个字节，那么将这5个字节的内容，在用utf-8编码读取的时候就会发生乱码问题。

将数组大小设置为5后读取。
ByteArrayOutputStream 解决上述问题

        FileInputStream is = new FileInputStream("C:\\Users\\Administrator\\Desktop\\char.txt");

        ByteArrayOutputStream baos = new ByteArrayOutputStream();
        byte[] bytes = new byte[1];
        int read = is.read(bytes);
        while (read != -1){
            baos.write(bytes,0,read); //内部会自动扩容
            read = is.read(bytes);
        }
        System.out.println(new String(baos.toByteArray()));
        baos.close();
        is.close();