大学计算机基础码,大学计算机基础字符的编码——区位码和国标码

《大学计算机基础字符的编码——区位码和国标码》由会员分享,可在线阅读,更多相关《大学计算机基础字符的编码——区位码和国标码(11页珍藏版)》请在人人文库网上搜索。

1、字符的编码,计算机是以二进制的形式存储和处理数据的,因此字符也必须按特定的规则进行二进制编码才能进入计算机。 字符编码的方法: 确定需要编码的字符总数; 将每一个字符按顺序确定序号,序号的大小无意义,仅作为识别与使用这些字符的依据。字符形式的多少涉及编码的位数,一.西文字符的编码 字符编码表示字符的二进制编码,常用的有ASCII(American Standard Code for Information Interchange,美国信息交换标准码)。 国际通用的是7位ASCII码,用7位二进制数表示一个字符的编码,共有27=128个不同的编码值,相应可以表示128个不同字符的编码,二. 汉字。

2、的编码 常用汉字6763个,分成两级:一级汉字有3 755个,按汉语拼音字母的次序排列;二级汉字有3 008个,按偏旁部首排列。 一个国标码用两个字节来表示一个汉字,每个字节的最高位为0。 为避开ASCII码表中的控制码,将GB 231280中的6 763个汉字分为94行、94列,代码表分94个区(行)和94个位(列)。 区位码由区号(行号)和位号(列号)构成,区位码最多可以表示9494=8 836个汉字。 区位码由4位十进制数字组成,前两位为区号,后两位为位号。在区位码中,0109区为特殊字符,1055区为一级汉字,5687区为二级汉字。例如汉字“中”的区位码为54 48,即它位于第54行、。

3、第48列。 区位码是一个4位十进制数,国标码是一个4位十六进制数,汉字输入区位码与国标码之间转换方法:将一个汉字的十进制区号和十进制位号分别转换成十六进制;然后再分别加上20H(十进制就是32),就成为汉字的国标码。 例如,汉字“中”字的区位码与国标码及转换如下: 区位码 5448D (3630)H 国标码 8680D (3630H+20 20H)= 5650H 二进制表示为:(00110110 00110000)B + (00100000 00100000)B =(01010110 01010000)B,三. 汉字的处理过程 从汉字编码的角度看,计算机对汉字信息的处理过程实际上是各种汉字编码。

4、间的转换过程。这些编码主要包括:汉字输入码、汉字内码、汉字地址码、汉字字形码等,汉字信息处理系统的模型,1)汉字输入码 2)汉字内码 对应于国标码,一个汉字的内码用2个字节存储,并把每个字节的最高二进制位置“1”作为汉字内码的标识,如果用十六进制来表述,就是把汉字国标码的每个字节上加一个(80)H(即二进制数10000000)。所以,汉字的国标码与其内码存在下列关系: 汉字的内码 = 汉字的国标码 + (8080)H,例如,在前面已知“中”字的国标码为(5650)H,则根据上述关系式得: “中”字的内码 =“中”字的国标码(5650)H + (8080)H = (D6D0)H 二进制表示为:(。

5、01010110 01010000)B + (10000000 10000000)B = (11010110 11010000)B,3)汉字内码汉字地址码 汉字地址码是指汉字库(这里主要指整字形的点阵式字模库)中存储汉字字形信息的逻辑地址码。需要向输出设备输出汉字时,必须通过地址码对汉字库进行访问。汉字库中,字形信息都是按一定顺序(大多数按标准汉字交换码中汉字的排列顺序)连续存放在存储介质中,所以汉字地址码也大多是连续有序的,而且与汉字内码间有着简单的对应关系,以简化汉字内码到汉字地址码的转换,4)汉字字形码 汉字字形码又称汉字字模,用于汉字在显示屏或打印机输出。汉字字形码通常有两种表示方式:点阵和矢量表示方式,汉字字形点阵机器编码。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值