UTF-8与GBK区别

最新推荐文章于 2022-12-27 15:41:29 发布

豆浆油条_煎bingo子

最新推荐文章于 2022-12-27 15:41:29 发布

阅读量929

点赞数

分类专栏： JAVA 文章标签：编码学

本文链接：https://blog.csdn.net/qq_45679015/article/details/108359139

版权

JAVA 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

本文探讨了UTF-8和GBK两种编码格式的差异。UTF-8编码中，一个中文字符由3个字节组成，而GBK编码中，一个中文字符占2个字节。英文字符在任一编码下都只占1个字节。

摘要由CSDN通过智能技术生成

根据编码格式不一样，对应的字节也不一样

如果是UTF-8:一个中文对应的是三个字节
如果是GBK:一个中文对应的是2个字节

默认使用UTF-8

public class ByteBitDemo {
    public static void main(String[] args) throws Exception{
        String a = "中";
        byte[] bytes = a.getBytes();
        for (byte aByte : bytes) {
            System.out.println(aByte);
            String s = Integer.toBinaryString(aByte);
            System.out.println(s);
        }

    }
}

SHOW— byte对应bit

运行程序：我们发现一个中文是有 3 个字节组成
在这里插入图片描述
设置为GBK

public class ByteBitDemo {
    public static void main(String[] args) throws Exception{
        String a = "中";
        byte[] bytes = a.getBytes("GBK");
        for (byte aByte : bytes) {
            System.out.println(aByte);
            String s = Integer.toBinaryString(aByte);
            System.out.println(s);
        }

    }
}

SHOW— byte对应bit
我们修改编码格式 , 编码格式改成 GBK ，我们在运行发现变成了 2 个字节
在这里插入图片描述
我们在看看英文，在不同的编码格式占用多少字节

默认在UTF-8下

public class ByteBitDemo {
    public static void main(String[] args) throws Exception{
        String a = "a";
        byte[] bytes = a.getBytes();
        for (byte aByte : bytes) {
            System.out.println(aByte);
            String s = Integer.toBinaryString(aByte);
            System.out.println(s);
        }

    }
}

SHOW
英文在UTF-8下占用1个字节
在这里插入图片描述

GBK下

public class ByteBitDemo {
    public static void main(String[] args) throws Exception{
        String a = "a";
        byte[] bytes = a.getBytes("GBK");
        for (byte aByte : bytes) {
            System.out.println(aByte);
            String s = Integer.toBinaryString(aByte);
            System.out.println(s);
        }

    }
}