汉字的表示方法


1.汉字的桥入编码
为了能直接使用西文标准键盘把汉字输入到计算机,就必须为汉字设计相应的输入编码方法。当前采用的方法主要有以下三类:
数字编码 常用的是国标区位码,用数字串代表一个汉字输入。区位码是将国家标准局公布的 6763 个两级汉字分为 94 个区,每个区分 94 位,实际上把汉字表示成二维数组。每个汉字在数组中的下标就是区位码。区码和位码各两位十进制数字,因此输入一个汉字需按继四次。例如“中”字位于第 54 区 48 位,区位码为 5448.
数字编码输入的优点是无重码,且输入码与内部编码的转换比较方便,缺点是代码难以记忆。
拼音码 拼音码是以汉语拼音为基础的输入方法。凡掌握汉语拼音的人,不需训练和记忆,即可使用。但汉字同音字太多,输入重码率很高,因此按拼音输入后还必须进行同音字选择,影响了输入速度。
字形编码 字形编码是用汉字的形状进行的编码。汉字总数虽多,但是由一笔一画组成,全部汉字的部件和笔画是有限的。因此,把汉字的笔画部件用字母或数字进行编码,按笔画的顺序依次输入,就能表示一个汉字。例如五笔字型编码是最有影响的一种字形编码方法。
除了上述三种编码方法之外,为了加快输入速度,在上述方法基础上,发展了词组输入、联想输入等多种快速输入方法。但是都利用了键盘进行“手动”输入。理想的输入方式是利用语音或图像识别技术“自动”将拼音或文本输入到计算机内,使计算机能认识汉字,听懂汉语,并将其自动转换为机内代码表示。目前这种理想已经成为现实。
2. 汉字内码
汉字内码是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用2字节表示。英文字符的机内代码是七位的 ASCII码,当用1字节表示时,最高位为“0”。为了与英文字符能相互区别,汉字机内代码中 2字节的最高位均规定为“1”。例如,汉字操作系统CCDOS 中使用的汉字内码是一种最高位为“1”的两字节内码。
有些系统中字节的最高位用于奇偶校验位,这种情况下用3字节表示汉字内码。
3. 汉字字模码
字模码是用点阵表示的汉字字形代码,它是汉字的输出形式。
根据汉字输出的要求不同,点阵的多少也不同。简易型汉字为16x16点阵,提高型汉字为 24x24 点阵、32x32 点阵,甚至更高。因此字模点阵的信息量是很大的,所占存储空间也很大。以 16x16点阵为例,每个汉字要占用 32字节,国标两级汉字要占用 256K字节。因此字模点阵只能用来构成汉字库,而不能用于机内存储。字库中存储了每个汉字的点阵代码。当显示输出或打印输出时才检索字库,输出字模点阵,得到字形。注意,汉字的输
不要混为一谈。
入编码、汉字内码、字模码是计算机中用于输入、内部处理、输出三种不同用途的编码,2 汉字内码
汉字内码是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用2字节表示。英文字符的机内代码是七位的 ASCII码,当用1字节表示时,最高位为“0”。为了与英文字符能相互区别,汉字机内代码中 2字节的最高位均规定为“1”。例如,汉字操作系统CCDOS 中使用的汉字内码是一种最高位为“1”的两字节内码。
有些系统中字节的最高位用于奇偶校验位,这种情况下用3字节表示汉字内码。
3. 汉字字模码
字模码是用点阵表示的汉字字形代码,它是汉字的输出形式。
根据汉字输出的要求不同,点阵的多少也不同。简易型汉字为16x16点阵,提高型汉字为 24x24 点阵、32x32 点阵,甚至更高。因此字模点阵的信息量是很大的,所占存储空间也很大。以 16x16点阵为例,每个汉字要占用 32字节,国标两级汉字要占用 256K字节。因此字模点阵只能用来构成汉字库,而不能用于机内存储。字库中存储了每个汉字的点阵代码。当显示输出或打印输出时才检索字库,输出字模点阵,得到字形。注意,汉字的输
不要混为一谈。
入编码、汉字内码、字模码是计算机中用于输入、内部处理、输出三种不同用途的编码,不能混为一谈。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值