NIO中的ByteBuffer读取中文错误的解决方法：MalformedInputException

最新推荐文章于 2024-04-25 10:38:45 发布

万小猿

最新推荐文章于 2024-04-25 10:38:45 发布

阅读量798

点赞数

分类专栏： NIO 文章标签： NIO nio buffer 新星计划

本文链接：https://blog.csdn.net/qq_40262372/article/details/117604778

版权

NIO 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一、出错原因

例子摆出：

   String raw = "长坂桥头杀气生，横枪立马眼圆睁。一声好似轰雷震，独退曹家百万兵。";
        Charset charset = StandardCharsets.UTF_8;
        byte[] bytes = charset.encode(raw).array();
        byte[] bytes2 = Arrays.copyOfRange(bytes, 0, 11);

        ByteBuffer bbuf = ByteBuffer.allocate(12);
        CharBuffer cbuf = CharBuffer.allocate(12);

        bbuf.put(bytes2);

        //将Position移动到最前面，开始读取
        bbuf.flip();
        System.out.println(charset.newDecoder().decode(bbuf));

这样运行代码会报错：java.nio.charset.MalformedInputException: Input length = 2

这个的意思说有2个不能识别的。

因为我们UTF-8，一个中文等于三个字节,中文标点占三个字节。一个英文字符等于一个字节,英文标点占一个字节。

我们这边只截取到半个中文因此报错。

二、解决方法

利用一个CharBuffer，再去编码的时候传入该CharBuffer

 public void  test_chinese() throws CharacterCodingException {
       String raw = "长坂桥头杀气生，横枪立马眼圆睁。一声好似轰雷震，独退曹家百万兵。";
        Charset charset = StandardCharsets.UTF_8;
        byte[] bytes = charset.encode(raw).array();
        byte[] bytes2 = Arrays.copyOfRange(bytes, 0, 11);

        ByteBuffer bbuf = ByteBuffer.allocate(13);
        CharBuffer cbuf = CharBuffer.allocate(13);

        bbuf.put(bytes2);

        //将Position移动到最前面，开始读取
        bbuf.flip();
     

        charset.newDecoder().decode(bbuf, cbuf ,true);
        cbuf.flip();

        char[] temp = new char[cbuf.length()] ;
        if(cbuf.hasRemaining()){
            cbuf.get(temp);
            System.out.println("here:" + new String(temp));
        }

        System.out.format("limit-pos-%d\n", bbuf.limit() - bbuf.position());

        Arrays.copyOfRange(bbuf.array(), bbuf.position(), bbuf.limit());
    }

结果：

here:长坂桥
limit-pos-2

三、总结

我们可以借用CharBuffer将有效的中文字符截取出来，通过position与Limit查看多出的无效编码，方便将其取出放入另外部分，形成完整的中文。

万小猿

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
NIO中的ByteBuffer读取中文错误的解决方法：MalformedInputException

一、出错原因例子摆出： String raw = "长坂桥头杀气生，横枪立马眼圆睁。一声好似轰雷震，独退曹家百万兵。"; Charset charset = StandardCharsets.UTF_8; byte[] bytes = charset.encode(raw).array(); byte[] bytes2 = Arrays.copyOfRange(bytes, 0, 11); ByteBuffer bbuf = B
复制链接

扫一扫