1. Unicode是全球文字统一编码。它把世界上的各种文字的每一个字符指定唯一编码, 实现跨语种、跨平台的应用。
2. 中文用户最常接触的汉字编码是Unicode。中文字符数量巨大, 日常使用的汉字数量有数千个, 再加上生僻字, 数量达到数万个。
3. 下面这个表格列出了中文字符集的Unicode编码范围
字符集 | 字数 | Unicode编码 |
CJK部首补充 | 128字 | 2E80-2EFF |
康熙字典部首 | 224字 | 2F00-2FDF |
表意文字描述符 | 16字 | 2FF0-2FFF |
CJK符号和标点 | 64字 | 3000-303F |
注音字母 | 46字 | 3100-312F |
注音字母扩展 | 32字 | 31A0-31BF |
CJK笔画 | 48字 | 31C0-31EF |
封闭式CJK文字和月份 | 256字 | 3200–32FF |
CJK兼容 | 256字 | 3300–33FF |
CJK统一表意文字扩展A | 6592字 | 3400-4DBF |
CJK统一表意文字(基本汉字) | 20989字 | 4E00-9FFC |
CJK兼容表意文字 | 512字 | F900-FAD9 |
CJK兼容形式 | 32字 | FE30–FE4F |
CJK统一表意文字扩展B | 42718字 | 20000-2A6DD |
CJK统一表意文字扩展C | 4149字 | 2A700-2B734 |
CJK统一表意文字扩展D | 222字 | 2B740-2B81D |
CJK统一表意文字扩展E | 5762字 | 2B820-2CEA1 |
CJK统一表意文字扩展F | 7473字 | 2CEB0-2EBE0 |
CJK兼容表意文字补充 | 544字 | 2F800-2FA1F |
CJK统一表意文字扩展G | 4939字 | 30000-3134A |