编程基础之字符编码

国际上广泛使用的字符编码有ASCII码、BCD码和Unicode码

1.美国信息交换标准码(ASCII码)

有7位码和8位码两种形式。在计算机存储单元中,一个字符的ASCII码占用一个字节。一个字节等于8个二进制位。

需要注意的是,ASCII码中的最高位是一个功能位,只用作奇偶校验。

奇偶校验是一种代码检测的方法,在代码的传送过程中 ,可能存在传输错误,这时就需要有代码校验的方法来判断传输过程中是否发生了错误。

奇偶校验法一般分为奇校验和偶校验两种。

奇校验规定:正确的代码一个字节中1个个数必须是奇数,如果不是奇数,那么就在最高位的地方添1来满足;

偶校验规定:正确的代码中一个字节中1的个数必须是偶数,如果不是偶数,那么就在最高位的地方添1来满足。

上述讲的情况都是基于七位码的ASCII码形式,这种编码方式由于最高位用于校验位,是功能位,并没有实际表示数的含义的作用,因此这种编码方式最多只能表示128个不同的字符。

如果要使得最高位也参与编码,这种编码则被称为扩展ASCII码,也就是8位码,这种情况下的ASCII码可以用来表示256个不同的字符。

2.Unicode编码

nicode编码采用16位二进制进行编码,这种情况下能表示的字符数远远超于ASCII编码(65536个不同的字符)。但是他把ASCII码和扩展ASCII码也吸收进去了。

3.BCD编码

BCD码是二进制编码的十进制数,有4位BCD码、6位BCD码和扩展BCD码三种。

汉字编码

我们查看ASCII码表知道,ASCII码只对英文字母、数字和标点符号进行编码。也就是说,ASCII码中没有针对汉字的编码方式,那么汉字如何进行编码呢?

计算机对汉字信息的处理过程实际上是各种汉字编码间的转换过程。

  1. 汉字信息交换码

什么是汉字信息交换码?汉字信息交换码是用于汉字信息处理系统之间或汉字信息处理系统与通信系统之间能够进行信息交换的汉字代码,简称交换码,也叫国际码。

他是为了使得系统、设备之间信息交换时候能够采用统一的形式而制定的。

我国颁布的国家标准为国际码,两个字节存储一个国际码。

  1. 汉字输入码

顾名思义,这是为了将汉字输入计算机而编制的代码。

  1. 汉字内码

汉字内码是为在计算机内部对汉字进行存储、处理而设置的汉字编码,它应该能够满足计算机内部存储、传输和处理的要求。

当一个汉字输入计算机后先转为内码,然后才能在计算机中传输和处理。

  1. 汉字字形码

目前大多以点阵的方式产生汉字,而确定这个点阵的编码就是汉字字形码。

  1. 汉字地址码

汉字库中常常存储着汉字的基本信息,而汉字地址码就是汉字库中存储汉字字形信息的逻辑地址码。

  1. BCD码
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值