在计算机系统内部使用的汉子编码是,数据库系统工程师考试汉字编码输入码

1.2.1计算机中数据的表示

4.汉字编码

汉字处理包括汉字的编码输人、汉字的存储和汉字的输出等环。节。也就是说计算机处理汉字,首先必须先将汉字代码化,即对汉字进行编码。无论西方的拼音文字还是汉字这种象形文字,它们的"意"都寓于它们的"形"和"音"上。前面介绍过,直接向计算机输人文字的字形和语音虽然可以实现,但还不够理想。在计算机内部直接处理,存储文字的字形和语音就更困难了,所以用计算机处理字符,尤其是处理汉字字符,一定要把字符代码化。

西文是拼音文字,基本符号比较少,编码比较容易,而且在一个计算机系统中,输人、内部处理、存储和输出都可以使用同一代码。汉字种类繁多,编码比拼音文字困难,而且在一个汉字处理系统中,输入、内部处理、存储和输出对汉字代码的要求不尽相同,所以用的代码也不尽相同。汉字信息处理系统在处理汉字和词语时,关键的问题是要进行一系列的汉字代码转换。

1)输入码

中文的字数繁多,字形复杂,字音多变,常用汉字就有7000个左右。在计算机系统中使用汉字,首先遇到的问题就是如何把汉字输人到计算机内。为了能直接使用西文标准键盘进行输入,必须为汉字设计相应的编码方法。汉字编码方法主要分为三类:数字编码,拼音码和字形码。

(1)数字编码。数字编码就是用数字串代表一个汉字的输入,常用的是国标区位码。国际区位码将国家标准局公布的6763个两级汉字分成94个区,每个区94位。它实际上把汉字表示成二维数组,区位和位码各为两位十进制数字,因此,输入一个汉字需要按键四次。例如,"中"字位于第54区48位,区位码为5448.

汉字在区位码表中的排列是有规律的。在94个分区中,115区用来表示字母、数字和符号,1687区为一级和二级汉字?一级汉字以汉语拼音为序排列,二级汉字以偏旁部首进行排列。使用区位码方法输人汉字时,必须先在表中査找汉字并找出对应的代码,才能输人。数字编码输人的优点是无重码,而且输入码和内部编码的转换比较方便,但是每个编码都是等长的数字串,代码难以记忆。

(2>拼音码。拼音码是以汉语读音为基础的输入方法。由于汉字同音字太多,输人重码率很髙,因此,按拼音输入后还必须进行同音宇选择,影响了输人速度。

<3)字形编码。字形编码是以汉字的形状确定的编码。汉字总数虽多,但都是由一笔一划组成的,全部汉字的部件和笔划是有限的。因此,把汉字的笔划部件用字母或数字进行编码,按笔划书写的顺序依次输人,就能表示一个汉字。五笔字型、表形码等便是这种编码法。五笔字形编码是最有影响的编码方法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值