编码的一些问题

UTF-8  是1byte~4byte的变换,汉字UTF-8存储的,一个汉字占3byte

GBK     汉字GBK存储的,一个汉字占2byte

UTF-16BE 汉字、字母都是2byte

UTF8和UTF16都是uincode 

 

"中国ABC"分别对应的编码,按顺序gbk,utf-8,utf-16be

11010110 11010000 10111001 11111010 01000001 01000010 01000011

注释:11010110 11010000   中

            10111001 11111010   国

            01000001                       A

            01000010                       B

            01000011                       C


11100100 10111000 10101101 11100101 10011011 10111101 01000001 01000010 01000011

注释:11100100 10111000 10101101    中

            11100101 10011011 10111101    国

            01000001                                            A

            01000010                                            B

            01000011                                            C


01001110 00101101 01010110 11111101 00000000 01000001 00000000 01000010 00000000 01000011

注释:01001110 00101101   中

            01010110 11111101   国

            00000000 01000001   A

            00000000 01000010   B

            00000000 01000011   C

同样:utf-8和utf-16be是可以转换的

11100100 10111000 10101101 11100101 10011011 10111101 01000001 01000010 01000011
01001110 00101101 01010110 11111101 00000000 01000001 00000000 01000010 00000000 01000011

如果一个汉字是utf-8的,是3byte。去掉第一个byte的前4位1110

                                                                      第二个byte的前2位10

                                                                      第三个byte的前2位10

按照颜色对比。下面的同理。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值