java读取文件编码格式并读取文件内容(杜绝所有乱码)

private static final Charset[] DEFAULT_CHARSETS;

    static {
        String[] names = {
                "UTF-8",
                "GBK",
                "GB2312",
                "GB18030",
                "UTF-16BE",
                "UTF-16LE",
                "UTF-16",
                "BIG5",
                "UNICODE",
                "US-ASCII"};
        DEFAULT_CHARSETS = Convert.convert(Charset[].class, names);
    } 


/**
     * 探测文件编码并根据文件编码读取文件内容
     *
     * @param file 文件
     * @return
     */
    public static Pair<String, Charset> readFileContentAutoDetectCharset(File file) {
        if (!FileUtil.exist(file)) {
            return Pair.of("", Charset.defaultCharset());
        }
        // 探测文件编码并根据文件编码读取文件
        try (BufferedInputStream in = FileUtil.getInputStream(file)) {
            final byte[] buffer = new byte[in.available()];
            while (in.read(buffer) > -1) {
                for (Charset charset : DEFAULT_CHARSETS) {
                    final CharsetDecoder decoder = charset.newDecoder();
                    try {
                        return Pair.of(decoder.decode(ByteBuffer.wrap(buffer)).toString(), charset);
                    } catch (CharacterCodingException ignore) {
                    }
                }
            }
        } catch (IOException e) {
            throw new BusinessException("文件读取错误!");
        }
        return Pair.of("", Charset.defaultCharset());
    }

怎么优美的读取文件不乱码,首先我们每次读取一个文件是不知道它的编码格式是什么样的,而常规方式是读取文件按照utf-8,但也会有编码是GBK,那么有没有一个工具能够自己读取到文件是什么编码格式,然后按照这个格式不乱码的读取文件呢?

那么这篇文章应运而生

  • 10
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值