ASCII表
ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准ISO/IEC 646。ASCII第一次以规范标准的类型发表是在1967年,最后一次更新则是在1986年,到目前为止共定义了128个字符。
ASCLL码是一种7位二进制编码,能表示27=128种国际上最通用的西文字符,是目前计算机中,特别是微型计算机中,使用最普遍的字符编码集。
字符分为:大小写字母、数字0~9(整数)、其他符号、控制符
大小规则
常见ASCII码的大小规则:09<AZ<a~z。 数字比字母要小。如 “7”<“F”; 数字0比数字9要小,并按0到9顺序递增。如 “3”<“8” ; 字母A比字母Z要小,并按A到Z顺序递增。如“A”<“Z” ; 同个字母的大写字母比小写字母要小32。如“A”<“a” 。
几个常见字母的ASCII码大小:
'A' = 65
'a' = 97
' ' = 32(空格)
'0' = 48
口诀:大A加上空格等于a。()
汉字编码
目前的文字编码标准主要有 ASCII、GB2312、GBK、Unicode等。ASCII 编码是最简单的西文编码方案。GB2312、GBK、GB18030 是汉字字符编码方案的国家标准。ISO/IEC 10646 和 Unicode 都是全球字符编码的国际标准。######GB2312-80 标准GB2312-80 是 1980 年制定的中国汉字编码国家标准。共收录 7445 个字符,其中汉字 6763 个。GB2312 兼容标准 ASCII码,采用扩展 ASCII 码的编码空间进行编码,一个汉字占用两个字节,每个字节的最高位为 1。具体办法是:收集了 7445 个字符组成 94*94 的方阵,每一行称为一个“区”,每一列称为一个“位”,区号位号的范围均为 01-94,区号和位号组成的代码称为“区位码”。区位输入法就是通过输入区位码实现汉字输入的。将区号和位号分别加上 20H,得到的 4 位十六进制整数称为国标码,编码范围为 0x2121~0x7E7E。为了兼容标准 ASCII 码,给国标码的每个字节加 80H,形成的编码称为机内码,简称内码,是汉字在机器中实际的存储代码GB2312-80 标准的内码范围是 0xA1A1~0xFEFE。######GBK 编码标准《汉字内码扩展规范》(GBK) 于1995年制定,兼容GB2312、GB13000-1、BIG5 编码中的所有汉字,使用双字节编码,编码空间为 0x8140~0xFEFE,共有 23940 个码位,其中 GBK1 区和 GBK2 区也是 GB2312 的编码范围。收录了 21003 个汉字。GBK向下与 GB 2312 编码兼容,向上支持 ISO 10646.1国际标准,是前者向后者过渡过程中的一个承上启下的产物。ISO 10646 是国际标准化组织ISO 公布的一个编码标准,即 Universal Multilpe-Octet Coded Character Set(简称UCS),大陆译为《通用多八位编码字符集》,台湾译为《广用多八位元编码字元集》,它与 Unicode 组织的Unicode编码完全兼容。ISO 10646.1 是该标准的第一部分《体系结构与基本多文种平面》。我国 1993 年以 GB 13000.1 国家标准的形式予以认可(即 GB 13000.1 等同于 ISO 10646.1)。
编程要求
根据提示,在右侧编辑器补充代码,输出字母p-Q的数值大小,理解英文姓名排序方法。
/**
2020年2月9日
这里是文档注释,你可以添加程序相关的功能、编者、时间等信息
*/
// 程序需要借用的标准头文件
#include <stdio.h>//插入标准化输入输出头文件
//主程序
int main(){
//请在此输入需要执行的代码
char a='p',b='Q',c;
c = a - b;
printf("%d\n",c);
// C11 即2011版标准要求所有的函数均需要返回
return 0;
}