国标码 区位码 机内码 输入码

本文介绍了汉字编码的基本概念,包括国标码、区位码和机内码。国标码是根据GB2312-80标准,使用两个字节的低7位编码94x94个字符,为汉字信息交换设定的标准。区位码是将汉字和图形符号放在94行94列的二维表中,通过区码和位码表示。国标码通过一定的转换得到,而机内码为了避免与ASCII码冲突,将国标码的每个字节加128。输入码则是根据不同输入法,如全拼、区位、五笔等,用于键盘输入汉字的编码方式。
摘要由CSDN通过智能技术生成

国标码

每个汉字有个二进制编码,叫汉字国标码。

在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。  

每个汉字使用2个字节。

共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示,原则上,两个字节可以表示 256×256=65536 种不同的符号,作为汉字编码表示的基础是可行的。但考虑到汉字编码与其它国际通用编码,如ASCII 西文字符编码的关系,我国国家标准局采用了加以修正的两字节汉字编码方案,只用了两个字节的低7位。这个方案可以容纳 128×128=16384 种不同的汉字,但为了与标准ASCII码兼容,每个字节中都不能再用32个控制功能码和码值为32的空格以及127的操作码(128-32-1-1=94,32:控制字符;1:码值为32的空格;1:码值为127,01111111)。所以每个字节只能有94个编码。这样,双七位实际能够表示的字数是:94×94=8836个。

国家标准局1980年颁布的《信息交换用汉字编码字符集"基本集》(代号为GB2312 80)将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(20H),因此也称为区位码。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级:第一级是常用汉字计 3755个,置于16-55区&#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值