汉字编码的发展历史

最新推荐文章于 2025-01-11 16:12:52 发布

赛博朋克的我

最新推荐文章于 2025-01-11 16:12:52 发布

阅读量727

点赞数 7

分类专栏： Java 文章标签： java

本文链接：https://blog.csdn.net/2301_80172843/article/details/140755994

版权

1. **ASCII 码**：计算机最早由美国人使用，他们制定了 ASCII 编码，用 8 位二进制（一个字节）表示字符，占用了 0 到 127 的编码，包含了 26 个大小写英文字母以及若干英文符号等。随后，许多欧洲国家也开始使用计算机，占用了 128 到 255 的位置，称为 ISO8859-1。

2. **GB2312**：20 世纪 80 年代中国开始大力发展计算机技术，为了显示汉字，推出了 GB2312 编码（1980 年公布）。它是对 ASCII 码的中文扩展，采用两个字节表示汉字编码。在计算机使用时，会判断字节是否在 0 到 127（ASCII 码范围），若是则为单字节的英文字母，否则联合后面的一个字节共同判断当前的汉字。GB2312 共收录了 6763 个常用汉字和 682 个图形字符。它参考了第一批异体字整理表（1955）、简化字总表（1964）和印刷通用汉字字形表（1965）等汉字规范标准，兼顾当时信息处理实际需要进行选字。该字符集广泛应用于国内 DOS 软件和简体 Windows 3.2 中，是汉字信息技术的第一个重要标准。

3. **GBK**：随着汉字使用需求的增加，GB2312 中收录的汉字不够用了，于是在 1995 年推出了 GBK 编码（汉字内码扩展规范）。它不再要求低字节一定是 127 号之后的内码，只要第一个字节大于 127 就固定表示这是一个汉字的开始。GBK 包括了 GB2312 的所有内容，还增加了近 20000 个新的汉字（包括繁体字）和符号。

4. **GB18030**：后来为了满足少数民族使用电脑的需求，在 GBK