GBK编码详细解析(附GBK码位分布图)

原创 2015年07月07日 17:30:35

1.GBK码位分布图



2.GBK码位说明


    GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。全部编码分为三大部分:

1. 汉字区。包括:
    a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。
    b. GB 13000.1 扩充汉字区。包括:
        (1) GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。
        (2) GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。

2. 图形符号区。包括:
    a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。
    b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“○”排列在此区。计符号 166 个。

3. 用户自定义区:分为(1)(2)(3)三个小区。
    (1) AAA1-AFFE,码位 564 个。
    (2) F8A1-FEFE,码位 658 个。
    (3) A140-A7A0,码位 672 个。
    第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。

参考资料:http://baike.baidu.com/link?url=Hi1z5qUwV8XPhunlRDVkgMuKdOassSy-S9MvCj8djumSeKNFVa7584Mo5kCNphWttbbNoSb7lta-S4dHbaKchaNVvNWxChGN3lbwlx6AuJq


相关文章推荐

Unicode对应GBK编码范围详细整理

  • 2015年08月25日 10:41
  • 27KB
  • 下载

php导出到Excel 或 CSV (附utf8、gbk 编码转换)

php导入到excel-支持utf8和gbk两种编码php导入到excel乱码是因为utf8编码在xp系统不支持所有utf8编码转码一下就完美解决了utf-8编码案例Php代码...

android 解析gbk编码格式的网络xml文件

1.网络接口: 如[urlStr下]:http://www.youdao.com/smartresult-xml/search.s?type=mobile&q=13454522345" 2.返...

汉字编码之GBK编码(附完整码表)

继续字符编码的学习。今天介绍一下GBK(汉字内码扩展规范),GB 2312 GB18030。引用网友的话可以概括一下: GBK和UTF8的区别:GBK就是在保存你的帖子的时候,一个汉字占用两个字节。。...
  • hherima
  • hherima
  • 2016年03月04日 12:21
  • 8311

pcm编码的方法及13折线的码位

  • 2011年01月09日 16:09
  • 95KB
  • 下载

utf-8和GBK编码文件互相转换

  • 2017年11月10日 09:18
  • 44KB
  • 下载

GBK,UTF-8,和ISO8859-1之间的编码与解码

Unicode、UTF-8 和 ISO8859-1到底有什么区别 将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF...

GBK 汉字内码扩展规范编码表

  • 2013年12月10日 12:59
  • 164KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:GBK编码详细解析(附GBK码位分布图)
举报原因:
原因补充:

(最多只允许输入30个字)