Java中CharSet字符集

最新推荐文章于 2025-03-24 09:37:00 发布

立小言先森

最新推荐文章于 2025-03-24 09:37:00 发布

阅读量4.5w

点赞数 9

分类专栏：【Java系列】文章标签： CharSet 编码解码

本文链接：https://blog.csdn.net/yaomingyang/article/details/79384330

版权

【Java系列】专栏收录该内容

210 篇文章

订阅专栏

本文详细介绍了Java NIO中字符集的操作方法，包括如何获取字符集、创建编码器和解码器，并通过实例展示了具体的编码和解码过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

java.nio.charset包中提供了Charset类，它继承了Comparable接口；还有CharsetDecoder、CharsetEncoder编码和解码的类，它们都是继承Object类。

Java中的字符使用Unicode编码，每个字符占用两个字节，16个二进制位，向ByteBuffer中存放数据的时候需要考虑字符的编码，从中读取的时候也需要考虑字符的编码方式，也就是编码和解码。

1.获取字符集有如下两种方式

        //返回指定的字符集CharSet
        Charset charset = Charset.forName("utf8");
        //返回虚拟机默认的字符集CharSet
        Charset charset = Charset.defaultCharset();

2.接下来我们使用字符集CharSet创建一个编码器和一个解码器

        //编码器
        CharsetEncoder encoder = charset.newEncoder();
        //解码器
        CharsetDecoder decoder = charset.newDecoder();

3.使用编码器和解码器解析数据

//编码，传入CharBuffer
ByteBuffer bytebuffer = encoder.encode(in);
//解码，传入ByteBuffer
CharBuffer charbuffer = decoder.decode(in);

4.具体使用案例

    public static void main(String[] args)  {
        Charset charset = Charset.forName("utf8");
        System.out.println(charset.name()+"--"+charset.canEncode());
        //返回一个包含该字符的别名，字符集的别名是不可变的
        Set<String> set = charset.aliases();
        Iterator<String> it = set.iterator();
        while(it.hasNext()) {
            System.out.println(it.next());
        }

        System.out.println("----------编码----------------");
        ByteBuffer buffer = charset.encode("sdf");
        System.out.println(buffer);

        System.out.println("缓冲区剩余的元素数--"+buffer.remaining());
        while(buffer.hasRemaining()) {
            System.out.println((char)buffer.get());
        }
        System.out.println("缓冲区剩余的元素数--"+buffer.remaining());
        System.out.println("----------解码----------------");
        //清空缓冲区，将限制设置恢复，如果定义了标记，则将它们丢弃
        buffer.flip();
    }