GB2312:
全称是GB2312-1980。共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排序,二级字3008,以偏旁排序。
汉字区的内码范围高字节从 B0-F7,低字节从 A1-FE,占用的码位是72*94=6768。其中有 5 个空位是 D7FA-D7FE。
在 Windows 中的代码页是 CP936。
GB13000-1993:
GB13000 等同于国际标准的《通用多八位编码字符集 (UCS)》 ISO10646.1,就是等同于 Unicode 的标准,
代码页等等的都使用UTF的一套标准。 。
GBK编码:
GBK 最初是由微软对 GB2312 的扩展,也就是 CP936 字码表 (Code Page 936)的扩展。
GBK并非国家正式标准。
收录了所有 Unicode 1.1 及 GB 13000.1-93 之中的汉字,但是编码方式与 Unicode 1.1 及 GB 13000.1-93 不同。
仅仅是 GB 2312 到 GB 13000.1-93 之间的过渡方案。
共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。
GB 18030:
GB 18030-2000收录了27533个汉字,GB 18030-2005收录了70244个汉字。
在GB 2312(GB 2311)的基础上进行扩充,并且在字汇上与GB 13000.1兼容的方案。
GB18030是国家标准,在技术上是GBK的超集,并与其兼容,因此,GBK将结束其历史使命。
GB18030 在 Windows 中的代码页是 CP54936。
所以从汉字包含来看,简单地可以说:
GB2312=ASCII+常用汉字+符号
GBK=GB2312+不常用字(含BIG5繁体汉字)+图形符号
GB18030=GBK+Ext-A+图形符号
Unicode=GB18030+Ext-B+……(如未发布的Ext-C及其它国家文字)
汉字编码标准
最新推荐文章于 2024-10-17 15:21:29 发布