UTF-8与GBK区别

本文探讨了UTF-8和GBK两种编码格式的差异。UTF-8编码中,一个中文字符由3个字节组成,而GBK编码中,一个中文字符占2个字节。英文字符在任一编码下都只占1个字节。
摘要由CSDN通过智能技术生成

根据编码格式不一样,对应的字节也不一样

  • 如果是UTF-8:一个中文对应的是三个字节
  • 如果是GBK:一个中文对应的是2个字节

默认使用UTF-8

public class ByteBitDemo {
    public static void main(String[] args) throws Exception{
        String a = "中";
        byte[] bytes = a.getBytes();
        for (byte aByte : bytes) {
            System.out.println(aByte);
            String s = Integer.toBinaryString(aByte);
            System.out.println(s);
        }

    }
}

SHOW— byte对应bit

运行程序:我们发现一个中文是有 3 个字节组成
在这里插入图片描述
设置为GBK

public class ByteBitDemo {
    public static void main(String[] args) throws Exception{
        String a = "中";
        byte[] bytes = a.getBytes("GBK");
        for (byte aByte : bytes) {
            System.out.println(aByte);
            String s = Integer.toBinaryString(aByte);
            System.out.println(s);
        }

    }
}

SHOW— byte对应bit
我们修改 编码格式 , 编码格式改成 GBK ,我们在运行发现变成了 2 个字节

在这里插入图片描述
我们在看看英文,在不同的编码格式占用多少字节

  • 默认在UTF-8下
public class ByteBitDemo {
    public static void main(String[] args) throws Exception{
        String a = "a";
        byte[] bytes = a.getBytes();
        for (byte aByte : bytes) {
            System.out.println(aByte);
            String s = Integer.toBinaryString(aByte);
            System.out.println(s);
        }

    }
}

SHOW
英文在UTF-8下占用1个字节

在这里插入图片描述

  • GBK下
public class ByteBitDemo {
    public static void main(String[] args) throws Exception{
        String a = "a";
        byte[] bytes = a.getBytes("GBK");
        for (byte aByte : bytes) {
            System.out.println(aByte);
            String s = Integer.toBinaryString(aByte);
            System.out.println(s);
        }

    }
}

SHOW
在这里插入图片描述

所以如果是英文,没有编码概念,全部对应一个字节
而在中文情况下,不同的编码格式,对应不同的字节

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值