GB 2312 汉字编码字符集

原创 2005年05月31日 08:15:00
 GB 2312 码是中华人民共和国国家标准汉字信息交换用编码,全称《信息交

换用汉字编码字符集 基本集》,标准号为 GB 2312-80(GB 是“国标”二字

的汉语拼音缩写),由中华人民共和国国家标准总局发布,1981年5月1日实施。

习惯上称国标码、GB 码,或区位码。它是一个简化字汉字的编码,通行于中国

大陆地区。新加坡等地也使用这一编码。

GB 2312-80 收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、

希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。其

中汉字以外的图形字符 682 个,汉字 6763 个。

GB 2312-80 规定,“对任意一个图形字符都采用两个字节(Byte)表示。

每个字节均采用 GB 1988-80 及 GB 2311-80 中的七位编码表示。两个字节中

前面的字节为第一字节,后面的字节为第二字节。”习惯上称第一字节为“高字

节”,第二字节为“低字节”。

GB 2312-80 将代码表分为 94 个区(Section),对应第一字节;每个区

94 个位(Position),对应第二字节。两个字节的值,分别为区号值和位号值

各加 32(20H)。

GB 2312-80 规定,01~09 区(原规定为 1~9 区,为表示区位码方便起

见,今改称 01~09 区)为符号、数字区,16~87 区为汉字区。而 10~15

区、88~94 区是有待于“进一步标准化”的“空白位置”区域。但第 10 区推

荐与第 3 区的 94 个图形字符(即 GB 1988-80 中的 94 个图形字符)相同,

字形宽度为其宽度的一半。

GB 2312-80 把收录的汉字分成两级。第一级汉字是常用汉字,计 3755 个,

置于 16~55 区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字,

计 3008 个,置于 56~87 区,按部首/笔画顺序排列。字音以普通话审音委员

会发表的《普通话异读词三次审音总表初稿》(1963年出版)为准,字形以中华

人民共和国文化部、中国文字改革委员会公布的《印刷通用汉字字形表》(1964

年出版)为准。



例:汉字“啊”,第一字节为 0110000,第二字节为 0100001,即 16 区、

01 位,用 16-01 表示。





注:

1. 有些外挂式的中文平台,不能正确显示 01~15 区的空白位置。

2. 02 区的 0201~0210、06 区的 0664~0685 和 08 区的 0827~0832 位

置,在 GB 2312-80 中原本规定为有待于进一步标准化的空白位置。但如果你

使用的操作系统为 Windows 95 简体中文版(及更高的版本),或者使用了其他

支持 GBK 码、CJK 码的汉字系统,在某些情况下会看到以上位置分别为 10 个



小写罗马数字、19 个中文竖排用符号和 6 个汉语拼音符号。这些符号系 GB

5007.1、GB/T 12345-90 及 GBK 增补的符号,由于 Windows 95 简体中文版使

用了 GBK 字体,所以显示出这些符号。此外第 10、11、12 区显示的汉字,也

属类似的情况。

3. GB 码的编码范围为 2121H~777EH,与 ASCII 码有重叠,通行将 GB 码

两个字节的最高位均置 1(MSB=1),以示区别。因此,实际应用的 GB 码是 GB

码高位置 1 后的变形码,编码范围为 0A1A1H~0F7FEH。如汉字“啊”,第一字

节为 10110000,第二字节为 10100001。

GB 2312 汉字编码字符集

google_ad_client = "pub-8800625213955058";/* 336x280, 创建于 07-11-21 */google_ad_slot = "0989131976";...
  • java169
  • java169
  • 2008年05月24日 03:35
  • 186

GB 2312

GB 2312 GB 2312 或 GB 2312-80 是中华人民共和国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,又称GB0,由中国国家标准总局发布,1981年5月...
  • haiross
  • haiross
  • 2015年04月16日 17:08
  • 481

信息处理交换用汉字编码字符集 GB2312-80

学习字库制作的时候需要用到这个,所以转过来学习学习! 中国于1981年发布了《信息处理交换用汉字编码字符集 基本集》GB2312-80 GB2312将代码表分为94个区,对应第一字...
  • King_BingGe
  • King_BingGe
  • 2013年04月09日 22:00
  • 3468

GB 2312 Character Map

Your computer has to have Chinese character font installed to view this page correctly. Refer to Cha...
  • gxj1680
  • gxj1680
  • 2011年04月28日 10:01
  • 33470

UTF-8转换成GB2312的全处理

主题:将UTF-8编码的字符串转化成GB2312的编码,没有对应编码的字符串转化为&#DEC; 的格式。如 회=>회语言:PHP,Javascript内容:浏览器用Javascript中...
  • d_einstein
  • d_einstein
  • 2005年09月07日 14:37
  • 1991

中文字符集编码Unicode,gb2312,cp936,GBK,GB18030

转自:http://www.blog.edu.cn/user3/flyingcs/archives/2006/1418577.shtml概要:UTF-8的一个特别的好处是它与ISO-8859-1完全兼...
  • zhangzhengyi03539
  • zhangzhengyi03539
  • 2015年10月21日 19:15
  • 1424

UTF-8与GB 2312编码

经常碰到UTF-8编码,但又说不出个所以缘来,今查了下,保存起来。        UTF8 是(UNICODE八位交换格式)的简称,UNICODE是国际标准,也是ISO标准10646的等价标准。UNI...
  • mociml
  • mociml
  • 2010年04月26日 21:52
  • 948

GB 2312 代码表 48~55 区

·参考资料·GB 2312 代码表 48~55 区4801234567890 小孝校肖啸笑效楔些1歇蝎鞋协挟携邪斜胁谐2写械卸蟹懈泄泻谢屑薪3芯锌欣辛...
  • abookdog
  • abookdog
  • 2005年02月19日 15:17
  • 765

GB 2312 代码表 40~47 区

·参考资料·GB 2312 代码表 40~47 区4001234567890 取娶龋趣去圈颧权醛1泉全痊拳犬券劝缺炔瘸2却鹊榷确雀裙群然燃冉3染瓤壤攘...
  • abookdog
  • abookdog
  • 2005年02月19日 15:16
  • 707

GB 2312 代码表 16~23 区

·参考资料·GB 2312 代码表 16~23 区1601234567890 啊阿埃挨哎唉哀皑癌1蔼矮艾碍爱隘鞍氨安俺2按暗岸胺案肮昂盎凹敖3熬翱袄傲...
  • abookdog
  • abookdog
  • 2005年02月19日 15:13
  • 663
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:GB 2312 汉字编码字符集
举报原因:
原因补充:

(最多只允许输入30个字)