GB2312-80编码演化

知识点记录

GB2312区位码—国标码—机内码----机内码字库寻址–c语言编码对应

1-区别

  1. 区位码:4位10进制数,例如1601,16代表区号,01代表位号。区号位号范围都是:01-94 (注意汉字的区号从16开始,如“啊”字1601是第一个汉字
    在这里插入图片描述
  2. 国标码:区位码 + 2020H (16进制)
  3. 机内码:(针对国标码的)计算机内部识别码 = 国标码 + 8080H
    (因此:机内码 = 区位码 + A0A0H)
    在这里插入图片描述

2-转换举例

在这里插入图片描述

3-汉字范围与对应C语言编码

区位码:常用汉字范围 1601—8794,也就是从第16区的第一位,直到第87的最后一位

机内码:常用汉字编码范围 0xB0A1-----0xF7FE,
对应10进制**(176-161)~(247-264)**其中FE-A1=254-161+1 = 94(10进制)

C语言:
eg: unsigned char str[]=" 你好 ",注意一个汉字占据 2个字节,此处4字节
unsigned char 一个字节 0xFF的范围是0~255 ,其中0-127表示 ASCII英文字符。

C的编译器将 128-255 用于表示中文字符,但必须是连续的2个字节才能表示一个中文字符,因此第一个字节X=(128-255)+第二个字节Y=(128-255),两个一起表示。

其中,C代码里:连续2个unsigned char :
c
-------第一个汉字XY=(176.161)~ ~最后一个汉字XY=(247.264)
正好对应了上文机内码的汉字范围

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值