什么是GB(gb2312)

GB2312或GB2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集--基本集》,由中国国家标准总局发布, 1981年5月1日实施。GB2312编码通行于大陆;新加坡等地也采用此编码。几乎所有的中文系统和国际化的软件都支持GB2312。
GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄罗斯语西里尔字母在内的682个全形字符。
GB2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖99.75%的使用频率。
对于人名、古汉语等方面出现的罕用字,GB2312不能处理,这导致了后来GBK及GB18030汉字字符集的出现。

接下来就是比较新的gb18030
* GB18030 也是对 GB2312 的扩展,其编码长度由 2 个字节变为 1~4 个字节
o 单字节,其值从 0 到 0x7F。
o 双字节,第一个字节的值从 0x81 到 0xFE,第二个字节的值从 0x40 到 0xFE(不包括 0x7F )。
o 四字节,第一个字节的值从 0x81 到 0xFE,第二个字节的值从 0x30 到 0x39,第三个字节的值从 0x81 到 0xFE ,第四个字节的值从 0x30 到 0x39 。
是以保持 GB2312/GBK 反向兼容的条件下,加入 4-byte 部份,让 GB18030 可以
完全地 一对一 映射到 Unicode U+0000..U+10FFFF,是一个「一劳永逸」的方案。

GB2312-1980 信息交换用汉字编码字符集 基本集
GB2312共收录6763个简体汉字,是一般输入法的默认编码

GB2312-1980 信息交换用汉字编码字符集 基本集
GB11383-1989 信息处理 信息交换用八位代码结构和编码规则
GB2311-1990 信息处理 七位和八位编码字符集代码扩充技术
GB12345-1990 信息交换用汉字编码字符集 辅助集
GB13000.1-1993 信息技术 通用多八位编码字符集(UCS)第一部分
GBK-1995 技术规范指导性文件 《汉字内码扩展规范(GBK)1.0版
GB18030-2000 信息技术 信息交换用汉字编码字符集 基本集的扩充
上面是我国颁布并实施的有关编码方案
-后面为发布年份 和名称
GB2312共收录6763个简体汉字,是一般输入法的默认编码
GBK共收录21004个汉字(包括简体和繁体),是字库庞大的输入法的首选编码
BIG5 即通常说的大五码,是港台地区使用的繁体中文编码规格。
GB18030 分别以单字节、双字节和四字节进行编码。兼容了GBK和GB2312。当然也支持繁体中文

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值