字符是指字母、数码、运算符号、标点符号等,当然汉字也属于字符,
1.基本ASCII码
用7位二进制数来给字符编码。7位二进制数共有27=128种不同组合,每一种组合可代表一种字符,即作为一种字符的编码。例如:
0110000(48)字符*0;1000001(65)字符A;
011000l(49)字符1;1000010(66)字符B;
0110010(50):字符2。
2.扩充ASCII码
用8位二进制数来给字符编码。即在基本ASCII码前面增加一个二进制位,共28=256种组合,可给256种字符编码。前128种,最高位为0,仍用于表示基本ASCIlI字符。如01000001(65)仍表示字符A。后128种,最高位为1,用于表示128种特殊符号,如制表符└、┘、├、┬等。
3.汉字编码
汉字编码涉及类型较多,这里仅介绍其中几种。
(1)国标码
国标码的全称是国家标准化信息用汉字编码。国标汉字共6763个,计算机中的字符编码》(https://www.unjs.com)。分为两级,一级汉字为常用汉字,共3755个;二级汉字为非常用汉字,共3008个。每个汉字对应4位十六进制数。如大的国标码为3473(16),写成二进制为0011010001110011。
(2)输入码
输入码是指将汉字输入到计算机中所用的编码,有几十种之多,且还在不断研究新的输入编码。目前常用的有十几种,如汉语拼音、五笔字型、自然码、区位码等。中文Windows环境下的智能ABC输入法属拼音输入法,初学者使用起来很方便。区位码又称国标区位码,是国标码的一种变型。它将国标汉字分成94个区,每个区又分成94个位置,区码、位码分别用两位十进制数表示,在计算机内部用这两位十进制数的BCD码表示。如大在20区、83位,其区位码为2083,在机内表示为0010000010000011。
(3)汉字内码
汉字内码是计算机系统内部处理、存储汉字所使用的统一代码。内码可由国标码变换而来,即将国标码的每个字节的最高位置1,其他位均不变,即可得到内码。例如,已知大的国标码为3473(16),写成二进制为0011010001110011,则大的内码为10110100llll00ll,写成十六进制为B4F3。
(4)字型点阵码
字型点阵码是显示或打印汉字时所用的编码。点阵中每一个位置对应一个二进制位:该位为1,对应的位置有点;为0,则对应的位置为空白。每8个二进制位组成一个点阵码字节。点阵的规模决定了点阵码的字节数。例如,采用1616点阵,一个汉字的字型点阵码为(1616)8=32个字节。