汉字编码标准

GB2312:
    全称是GB2312-1980。共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排序,二级字3008,以偏旁排序。
    汉字区的内码范围高字节从 B0-F7,低字节从 A1-FE,占用的码位是72*94=6768。其中有 5 个空位是 D7FA-D7FE。
    在 Windows 中的代码页是 CP936。
   
GB13000-1993:
    GB13000 等同于国际标准的《通用多八位编码字符集 (UCS)》 ISO10646.1,就是等同于 Unicode 的标准,
    代码页等等的都使用UTF的一套标准。 。
   
GBK编码:
    GBK 最初是由微软对 GB2312 的扩展,也就是 CP936 字码表 (Code Page 936)的扩展。
    GBK并非国家正式标准。
    收录了所有 Unicode 1.1 及 GB 13000.1-93 之中的汉字,但是编码方式与 Unicode 1.1 及 GB 13000.1-93 不同。
    仅仅是 GB 2312 到 GB 13000.1-93 之间的过渡方案。
    共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。

GB 18030:
    GB 18030-2000收录了27533个汉字,GB 18030-2005收录了70244个汉字。
    在GB 2312(GB 2311)的基础上进行扩充,并且在字汇上与GB 13000.1兼容的方案。
    GB18030是国家标准,在技术上是GBK的超集,并与其兼容,因此,GBK将结束其历史使命。
    GB18030 在 Windows 中的代码页是 CP54936。
        
        
所以从汉字包含来看,简单地可以说:
    GB2312=ASCII+常用汉字+符号
    GBK=GB2312+不常用字(含BIG5繁体汉字)+图形符号
    GB18030=GBK+Ext-A+图形符号
    Unicode=GB18030+Ext-B+……(如未发布的Ext-C及其它国家文字)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值