字符/汉字在机器中的表示

字符/汉字在机器中的表示

 

字符的表示

人们可以通过键盘和显示器输入和显示不同的字符,但在计算机中,所有信息都 是用二进制代码表示。
n
位二进制代码能表示2n个不同的字符,这些字符的不同组合就可表示不同的信息。为使计算机使用的数据
能共享和传递,必须对字符进行统一的 编码。 1 ASCII码(美国标准信息交换码)是使用最广泛的一种
编码。ASCII码由基本的ASCII码和扩充的ASCII码组成。在ASCII码中,把二进制位最高位为0的数字都称为
基本的ASCII码,其范围是0127;把二进制位最高位为1的数字都称为扩展的ASCII码,其范围是128255


内码和外码

内码:对于输入计算机的文本文件,机器是存储其相应的字符的ASCII码(用一个ASCII码存储一个字符
8个二进制位,即一个字节),这些可被计算机内部进行存储和运算使用的数字代码称内码。如输入字符
"A"
,计算机将其转成内码65后存于内存。
外码:计算机与人进行交换的字形符号称为外码,如字符"A"的外码是"A"
通常一个西文字符占一个字节(半角),一个中文字符占二个字节。

汉字的表示方法
1.
汉字的输入编码 为能直接使用西文标准键盘输入汉字,必须为汉字设计相应的输入编码方法。
主要有以下三类:
a
数字编码: 常用的是国标区位码,用数字串代表一个汉字输入。区位码将6763个两级
汉字分为94个区,每个区分94位,实际上把汉字表示成二维数组,每个汉字在数组中的下标就是区位码。
区码和位码各两位十进制数字,如""字位于第5448位,区位码为5448
b
拼音码: 拼音码是以汉语拼音为基础的输入方法。因汉字同音字太多,重码率高,因此输入后还需进
行同音字选择。
c
字形编码:字形编码是以汉字的形状来进行的编码。把汉字的笔划部件用字母或数字进行编码,按笔划
顺序依次输入,就能表示一个汉字。如五笔字型编码。
2.
汉字内码 汉字内码是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示。
英文字符的机内代码是七位的ASCII码,当用一个字节表示时,最高位为0,为与之相区别,汉字机内代码中
两个字节的最高位均为1
3.
汉字字模码 字模码是用点阵表示的汉字字形代码,它是汉字的输出形式。 根据汉字输出要求不同,
点阵的多少也不同。简易型汉字为16×16点阵,提高型汉字为24×24点阵、32×32点阵或更高。因此字模点
阵的信息量是很大的,所占存储空间也很大。如16×16点阵,每个汉字占32字节,国标两级汉字要占用256K
字节。因此字模点阵只能用来构成汉字库,而不能用于机内存储。字库中存储了每个汉字的点阵代码。当显
示输出或打印输出时才检索字库,输出字模点阵,得到字形。如下图示出?quot;"字的点阵及代码。

 

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值