【做个笔记】中文字符编码的方案

1.出现时间

GB2312(80年)->GBK(1995)->GB18030(2005)

2.编码规则

(1)GB2312和GBK规则一致

对于 ASCII 字符,使用一个字节存储,并且该字节的最高位是 0,这意味着兼容ASCII。
对于中国的字符,使用两个字节存储,并且规定每个字节的最高位都是 1

(2)GB18130的编码规则

对于 ASCII 字符,使用一个字节存储,并且该字节的最高位是 0,这和 ASCII、GB2312、GBK 编码是一致的。
对于常用的中文字符,使用两个字节存储,并且规定第一个字节的最高位是 1,第二个字节的高位最多只能有一个连续的 0(第二个字节的最高位可以是 1 也可以是 0,但是当它是 0 时,次高位就不能是 0 了)。
对于罕见的字符,使用四个字节存储,并且规定第一个和第三个字节的最高位是 1,第二个和第四个字节的高位必须有两个连续的 0。

(3)如何判断用文本占了几个字节

从左往右扫描,如何第一个字节的高位是0,肯定只占用一个字节。
如果第一个字节的高位是1,那么可能占用四个字节或者两个字节。
继续判断第二个字节,如果第二个字节的高位没有两个连续的0,那就是占用了两个字节,如果有两个连续的0,那就是占用了四个字节

以上学习心得,当个笔记看

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值