一个汉字是几个字节

一个汉字是几个字节

常用中文字符用utf-8编码占用3个字节(大约2万多字),但超大字符集中的更大多数汉字要占4个字节(在unicode编码体系中,U+20000开始有5万多汉字)。
GBK、GB2312收编的汉字占2个字节,严格地用iso8859-1无法表示汉字,只能转为问号。

代码演示如下

public static void main(String[] args) throws UnsupportedEncodingException {
        
        String s = "我";

        System.out.println(s.getBytes("UTF-8").length);
        byte[] utfBytes = s.getBytes("UTF-8");
        for (byte b : utfBytes) {
            System.out.print(b);
        }

		System.out.println();
        System.out.println(s.getBytes("GBK").length);
        byte[] gbkBytes = s.getBytes("GBK");
        for (byte b : gbkBytes) {
            System.out.print(b);
        }
    }

运行结果:

3
-26,-120,-111
2
-50,-46

》》》博主长期更新学习心得,推荐点赞关注!!!
》》》若有错误之处,请在评论区留言,谢谢!!!

  • 5
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值