1. **ASCII 码**:计算机最早由美国人使用,他们制定了 ASCII 编码,用 8 位二进制(一个字节)表示字符,占用了 0 到 127 的编码,包含了 26 个大小写英文字母以及若干英文符号等。随后,许多欧洲国家也开始使用计算机,占用了 128 到 255 的位置,称为 ISO8859-1。
2. **GB2312**:20 世纪 80 年代中国开始大力发展计算机技术,为了显示汉字,推出了 GB2312 编码(1980 年公布)。它是对 ASCII 码的中文扩展,采用两个字节表示汉字编码。在计算机使用时,会判断字节是否在 0 到 127(ASCII 码范围),若是则为单字节的英文字母,否则联合后面的一个字节共同判断当前的汉字。GB2312 共收录了 6763 个常用汉字和 682 个图形字符。它参考了第一批异体字整理表(1955)、简化字总表(1964)和印刷通用汉字字形表(1965)等汉字规范标准,兼顾当时信息处理实际需要进行选字。该字符集广泛应用于国内 DOS 软件和简体 Windows 3.2 中,是汉字信息技术的第一个重要标准。
3. **GBK**:随着汉字使用需求的增加,GB2312 中收录的汉字不够用了,于是在 1995 年推出了 GBK 编码(汉字内码扩展规范)。它不再要求低字节一定是 127 号之后的内码,只要第一个字节大于 127 就固定表示这是一个汉字的开始。GBK 包括了 GB2312 的所有内容,还增加了近 20000 个新的汉字(包括繁体字)和符号。
4. **GB18030**:后来为了满足少数民族使用电脑的需求,在 GBK