“21天好习惯“ 第一期--17

汉字编码包括输入码、内部码和交换码。输入码用于方便输入,如拼音码、字形码等;内部码是计算机内部存储和处理汉字的代码,如ASCII兼容的双字节编码;交换码则是不同系统间交换汉字信息的标准,如GB2312,包含6763个汉字和682个图形字符。国家标准的推出促进了汉字编码的统一和标准化。
摘要由CSDN通过智能技术生成

接上文

2.汉字编码简介
与西文字符不同,汉字字符很多,所以汉字编码比西文编码复杂。在一个汉字信息处理系统的不同部位,需使用几种编码,可分属下述三类:输入码、内部码、交换码。

(1)汉字输入码
对于绝大多数汉字输入人员来说,要直接记住数千个个汉字的二进制码非常困难,键盘上也很难将几千个汉字都做成按键,所以需要一些比较直观、方便、快速的汉字输入方法。为此,研究人员已经提出了至少几百种汉字编码方案,较常使用的也有几十种之多。归纳起来,采用的方法可分为几类:拼音码、字形码、音形结合、联想功能等方案。产生的输入码需要借助输入码与内部码的对照表(称为输入字典)才能转换成便于计算机处理的内部码。

(2)汉字内部码
汉字内部码简称内码,是计算机内部存储、处理、传输用的代码。在早期,不同的设计者设计了自己的汉字内码,因而各种计算机使用的汉字内码不统一,这造成了交换汉字信息时的困难。当我国推出了汉字交换码的国家标准之后,于1990年又提出了基于ASCII代码体系的汉字内码推荐方案,它与国标汉字交换码有一种简单的对应关系,用双字节编码表示一个汉字。

(3)汉字交换码
如前所述,早期的各种汉字系统的内码不统一,因此在各汉字系统之间或汉字系统与通信系统之间进行汉字信息交换(即传输)时,需要制定一种编码标准,即汉字交换码。

首先,我国制定了《信息处理交换用的七位编码字符集》,后来成为国家标准,除个别字符(如货币符号)外,字符与ASCII一致,可视为ASCII的中国版本。

1981年,我国公布了汉字交换码的国家标准《信息交换用汉字编码字符集—基本集》(GB2312-1980),用2字节构成一个汉字字符编码,收录了6763个汉字字符和682个非汉字图形字符(如间隔、标点、运算符、制表符、数字、汉语拼音、拉丁文字母、希腊文字母、俄文字母、日文假名等)。它们排成一个94×94的行列矩阵,矩的行称为区,列称为位,相应地,每个字符处于某区、某位。而字符的国际交换码与区位号有一个简单的对应关系。

以后,我国陆续公布了汉字交换码的5个辅集,收录了更多的汉字字符。

从几个标准的推出时间看,首先制定了ASCII的中国版,以便与国际接轨,一开始作为部颂标准,后来成为国家标准。在ASCII体系的基础上制定了汉字交换码的国家标准,然后陆续予以补充完善。再往后,在汉字交换码的国际基础上,提出了汉字内码的推荐方案。目前,内码推荐方案还不完全等同于汉字交换码国标,但两者之间存在简单的对应关系。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值