由于编码规则是固定的,因此汉字编码后的结果也是确定的,因此可以直接使用字典查找方法进行编解码,本文列举下编码后对应的数值,方便查找。
概要说明
GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。整个字符集分成94个区,每区有94个位。
GB2312,又称为GB0,由中国国家标准总局发布,1981年5月1日实施,GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个,GB2312只是编码表,在计算机中通常都是用"EUC-CN"表示法,即在每个区位加上0xA0来表示。区和位分别占用一个字节。GB2312是一种区位码。分为94个区(01-94),每区94个字符(01-94)。
- 01-09区为特殊符号
- 10-15区没有编码
- 16-55区为一级汉字,按拼音排序,共3755个
- 56-87区为二级汉字,按部首/笔画排序,共3008个
- 88-94区没有编码
详细编码对照表
GB2312汉字编码字符集对照表:(点击传送门进入)