GBK编码详细解析(附GBK码位分布图)

原创 2015年07月07日 17:30:35

1.GBK码位分布图



2.GBK码位说明


    GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。全部编码分为三大部分:

1. 汉字区。包括:
    a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。
    b. GB 13000.1 扩充汉字区。包括:
        (1) GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。
        (2) GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。

2. 图形符号区。包括:
    a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。
    b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“○”排列在此区。计符号 166 个。

3. 用户自定义区:分为(1)(2)(3)三个小区。
    (1) AAA1-AFFE,码位 564 个。
    (2) F8A1-FEFE,码位 658 个。
    (3) A140-A7A0,码位 672 个。
    第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。



版权声明:本文为博主原创文章,未经博主允许不得转载。

IOS 解析GBK编码

最近在做一个网络应用,收到xml是GBK编码的,我用UTF8去编码,结果返回nil的结果,明显是编码方法用错了,得用GBK的编码方式。 unsigned long encode = CFString...
  • yangzhongxuan
  • yangzhongxuan
  • 2013年05月28日 09:25
  • 3081

GBK编码下jQuery Ajax中文乱码终极暴力解决方案

哎,还是老话题,一直缠绕着国人…… 现在来个快刀斩乱麻,let’s go 由于项目前期使用的是1.2.6版本,后期使用的是1.3.2版本,所以分开来讲; 说说实现的办法,有点暴力——直接修改jQury...
  • shimiso
  • shimiso
  • 2010年07月08日 18:37
  • 6356

彻底搞懂编码 GBK 和 UTF8

首先来看一下常用的编码有哪些,截图自Notepad++。其中ANSI在中国大陆即为GBK(以前是GB2312),最常用的是 GBK 和 UTF8无BOM 编码格式。后面三个都是有BOM头的文本格式,U...
  • VGWCIrO8NU
  • VGWCIrO8NU
  • 2017年03月06日 17:13
  • 1741

python解析gbk编码的xml

python解析xml,由于某些协会规定的原因,只能解析utf8和utf16的格式,而gbk和gb2312等解析的时候都会报错,但是对于某些...
  • whzhcahzxh
  • whzhcahzxh
  • 2014年06月23日 15:34
  • 1836

GBK汉字编码范围

汉字编码范围备注 编码范围 1. GBK (GB2312/GB18030) x00-xff GBK双字节编码范围 x20-x7f ASCII xa1-xff 中文 x80-xff ...
  • jodan179
  • jodan179
  • 2013年06月30日 19:14
  • 3911

关于python编码问题无法读取GBK文件

昨天碰到了一个问题,关于python对日志处理发现出现了一个报错,最后才发现日志里面有中文: UnicodeDecodeError: 'gbk' codec can't decode byte 0x...
  • u012814696
  • u012814696
  • 2017年02月28日 09:35
  • 387

ios字符串编码转换(utf-8 & gbk)问题[参考]

前端部分来自参考资料: 我的地盘 CALL ME SING,STEVEN SING!!我们知道,使用NSURLConnection的代理方法下载网页,存到一个NSData中, NSMutableD...
  • lqcjdx
  • lqcjdx
  • 2014年11月27日 15:35
  • 1581

GBK/GB2312编码问题分析以及java获取汉字国标码

编码问题分析 个人经验:   这几天在公司,发报文调试接口的时候由于使用UTF8跟GBK两种编码很头疼。页面显示为utf8码,但是解析报文使用的却是GBK,这样就会出现两种情况,要么你调试页面是正常的...
  • First_sight
  • First_sight
  • 2015年12月21日 14:42
  • 1227

.net c# GBK编码

//地址编码 gbk     public static string UrlEncode(string dataStr)     {         return HttpUtility.Ur...
  • goodyatou
  • goodyatou
  • 2014年08月11日 11:27
  • 5418

vim正常显示gbk编码文件

 gedit ~/.vimrc加入以下内容:let &termencoding=&encodingset fileencodings=utf-8,gb18030,gbk,gb2312,big5 原理说...
  • guanggy
  • guanggy
  • 2009年11月11日 19:38
  • 7372
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:GBK编码详细解析(附GBK码位分布图)
举报原因:
原因补充:

(最多只允许输入30个字)