64位 int 占几个字节_一个汉字占几个字节你真的记住了吗?

v2-2dbfcb28c5a397fb441353cd7d87b6a4_1440w.jpg?source=172ae18b

一个汉字占几个字节是不是不太好记呢,编码不一样则占字节位就不一样。下面用一段简短的代码了解一下一个汉字占几个字节。

示例

String s = "情系IT";
        try {
            byte[] bytes1 = s.getBytes("gbk");
            for (byte b : bytes1) {
                System.out.print(Integer.toHexString(b & 0xff)+"  ");
            }
            System.out.println();
            byte[] bytes2 = s.getBytes("utf-8");
            for (byte b : bytes2) {
                System.out.print(Integer.toHexString(b & 0xff)+"  ");

            }
        } catch (UnsupportedEncodingException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

下面是运行结果:

v2-bac15f195380024ef61df917d67e4ca1_b.jpg

解析

  1. Integer.toHexString(int a),这个是java API提供的一个方法,目的是返回整数参数的字符串表示形式,作为16位中的无符号整数。
  2. 为什么要用b & 0xff ?
  • Integer.toHexString(int a),需要的是一个int类型的参数。
  • 0xff代表的就是16进制的11111111。
  • 我们知道byte是1个字节,int是4个字节,也就是要将8位转换为32位。如果无符号位的话,我们直接补0即可。因此&0xff就是为了保证符号位。
  • 举个例子:-127转为二进制为11111111,取反求补则为10000001,转十六进制则为81,继续转成十进制,看成无符号数就会发现变成了129。

总结

根据结果我们可看出,字符串是utf-8编码,一个汉字三个字节,一个字母一个字节。字符串是gbk编码时,一个汉字两个字节,一个字母一个字节。
如果想看其他编码下的情况,可复制上面的代码,将字符串进行其他编码查看即可。注意:如果字符串不进行编码,则默认为项目的编码。

如果文章对您有帮助,请记得点赞关注哟~ 欢迎大家关注我的公众号:情系IT,每日推送技术文章供大家学习参考。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值