GB2312和GBK的区别

1、收录不同:GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;

                        GBK共收入21886个汉字和图形符号。

2、表示不同:GB2312对任意一个图形字符都采用两个字节表示,并对所收汉字进行了“分区”处理,每区含有94个汉字/符号,分别对应第一字节和第二字节。

                       GBK采用双字节表示,总体编码范围为8140-FEFE之间,首字节在81-FE之间,尾字节在40-FE之间。

3、处理功能不同:对于人名、古汉语等方面出现的罕用字,GB2312不能处理,这导致了后来GBK 及GB18030 汉字字符集的出现。

 

GBK: 汉字国标扩展码,基本上采用了原来GB2312-80所有的汉字及码位,并涵盖了原Unicode中所有的汉字20902,总共收录了883个符号, 21003个汉字及提供了1894个造字码位。

             Microsoft简体版中文Windows 95就是以GBK为内码,又由于GBK同时也涵盖了Unicode所有CJK汉字,所以也可以和Unicode做一一对应。

GB码,全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯一中文编码。

            P-Windows3.2和苹果OS就是以GB2312为基本汉字编码, Windows 95/98则以GBK为基本汉字编码、但兼容支持GB2312。

              GB码共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排序,二级字3008,以偏旁排序。该标准的制定和应用为规范、推动中文信息化进程起了很大作用。

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
GBKGB2312都是中文字符编码标准,它们在字符集范围和编码规则上有些不同。转换GBK编码至GB2312编码的过程也就是将GBK编码的字符转换为GB2312编码的字符。 首先,需要打开一个GBK编码的压缩包文件,可以使用相关的解压缩软件来完成。然后,读取压缩包中的文件内容。由于GBKGB2312都是常用的中文字符编码,所以读取的文件内容通常会以GBK编码的方式进行编码。 接下来,我们需要将读取到的GBK编码的文件内容转换为GB2312编码。将GBK编码转换为GB2312编码的方法有很多种,可以使用编程语言中相关的库函数或工具进行转换。常见的转换方式是使用iconv命令行工具或者在编程语言中使用相关的转换函数。 在进行文件内容的编码转换之后,即将GBK编码转换为GB2312编码,可以将转换后的文件内容保存到一个新的文件中,也可以在内存中进行处理之后再进行相关操作。转换完毕后,就可以使用GB2312编码来处理文件内容了。 需要注意的是,由于GBKGB2312是有一定差异的字符编码标准,转换的过程中可能会遇到一些无法转换的字符或者出现错误的情况。因此,在进行转换操作时,需要对转换结果进行验证和检查,以确保转换的准确性和完整性。 总之,将GBK编码的压缩包转换为GB2312编码的过程可以通过使用相关的工具或编程语言来完成,但需要注意转换后的准确性和完整性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值