Unicode blocks 统计

本文介绍了Unicode字符,包括特殊区域的处理,如代理区,并探讨了大小写的转换特殊情况。特别提到了拉丁文大写字母Sharp S(ẞ)与小写字母(ß)的转换问题。此外,解释了UTF-16编码如何处理超过65536个字符的Unicode标准,涉及到High和Low Surrogates的概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

开始码位 结束码位 Block名称(英文) Block名称(中文) 区间 已用 可显 不显 文字 数字 符号 大写 小写 未用 禁用
0000 007F Basic Latin 基本拉丁字母 128 128 95 33 52 10 33 26 26 0 0
0080 00FF Latin-1 Supplement 拉丁文补充1 128 128 94 34 65 6 23 30 35 0 0
0100 017F Latin Extended-A 拉丁文扩展A 128 128 128 0 128 0 0 63 65 0 0
0180 024F Latin Extended-B 拉丁文扩展B 208 208 208 0 208 0 0 103 96 0 0
0250 02AF IPA Extensions 国际音标扩展 96 96 96 0 96 0 0 0 95 0 0
02B0 02FF Spacing Modifier Letters 占位修饰符号 80 80 80 0 37 0 43 0 16 0 0
0300 036F Combining Diacritical Marks 结合附加符号 112 112 112 0 0 0 112 0 1 0 0
0370 03FF Greek and Coptic 希腊字母及科普特字母 144 135 135 0 129 0 6 60 68 9 0
0400 04FF Cyrillic 西里尔字母 256 256 256 0 248 0 8 124 124 0 0
0500 052F Cyrillic Supplement 西里尔字母补充 48 48 48 0 48 0 0 24 24 0 0
0530 058F Armenian 亚美尼亚字母 96 91 91 0 80 0 11 38 41 5 0
0590 05FF Hebrew 希伯来文 112 88 88 0 31 0 57 0 0 24 0
0600 06FF Arabic 阿拉伯文 256 255 247 8 153 20 74 0 0 1 0
0700 074F Syriac 叙利亚文 80 77 76 1 34 0 42 0 0 3 0
0750 077F Arabic Supplement 阿拉伯文补充 48 48 48 0 48 0 0 0 0 0 0
0780 07BF Thaana 它拿字母 64 50 50 0 39 0 11 0 0 14 0
07C0 07FF NKo 西非书面语言 64 62 62 0 36 10 16 0 0 2 0
0800 083F Samaritan 撒玛利亚字母 64 61 61 0 25 0 36 0 0 3 0
0840 085F Mandaic 曼達克字母 32 29 29 0 25 0 4 0 0 3 0
0860 086F Syriac Supplement 叙利亚文补充 16 11 11 0 11 0 0 0 0 5 0
870 89F Undefined 未定义 48
08A0 08FF Arabic Extended-A 阿拉伯语扩展 96 84 83 1 39 0 44 0 0 12 0
0900 097F Devanagari 天城文 128 128 128 0 81 10 37 0 0 0 0
0980 09FF Bengali 孟加拉文 128 96 96 0 55 16 25 0 0 32 0
0A00 0A7F Gurmukhi 果鲁穆奇字母 128 80 80 0 51 10 19 0 0 48 0
0A80 0AFF Gujarati 古吉拉特文 128 91 91 0 53 10 28 0 0 37 0
0B00 0B7F Oriya 奥里亚文 128 91 91 0 53 16 22 0 0 37 0
0B80 0BFF Tamil 泰米尔文 128 72 72 0 37 13 22 0 0 56 0
0C00 0C7F Telugu 泰卢固文 128 98 98 0 56 17 25 0 0 30 0
0C80 0CFF Kannada 卡纳达文 128 89 89 0 56 10 23 0 0 39 0
0D00 0D7F Malayalam 马拉雅拉姆文 128 118 118 0 67 26 25 0 0 10 0
0D80 0DFF Sinhala 僧伽罗文 128 91 91 0 59 10 22 0 0 37 0
0E00 0E7F Thai 泰文 128 87 87 0 57 10 20 0 0 41 0
0E80 0EFF Lao 老挝文 128 82 82 0 56 10 16 0 0 46 0
0F00 0FFF Tibetan 藏文 256 211 211 0 50 20 141 0 0 45 0
1000 109F Myanmar 缅甸文 160 160 160 0 74 20 66 0 0 0 0
10A0 10FF Georgian 格鲁吉亚字母 96 88 88 0 87 0 1 40 46 8 0
1100 11FF Hangul Jamo 谚文字母 256 256 256 0 256 0 0 0 0 0 0
1200 137F Ethiopic 埃塞俄比亚语 384 358 358 0 326 20 12 0 0 26 0
1380 139F Ethiopic Supplement 埃塞俄比亚语补充 32 26 26 0 16 0 10 0 0 6 0
13A0 13FF Cherokee 切罗基字母 96 92 92 0 92 0 0 86 6 4 0
1400 167F Unified Canadian Aboriginal Syllabics 统一加拿大原住民音节文字 640 640 640 0 637 0 3 0 0 0 0
1680 169F Ogham 欧甘字母 32 29 28 1 26 0 2 0 0 3 0
16A0 16FF Runic 卢恩字母 96 89 89 0 83 3 3 0 0 7 0
1700 171F Tagalog 他加禄字母 32 20 20 0 17 0 3 0 0 12 0
1720 173F Hanunoo 哈努诺文 32 23 23 0 18 0 5 0 0 9 0
1740 175F Buhid 布迪文 32 20 20 0 18 0 2 0 0 12 0
1760 177F Tagbanwa 塔格巴努亚文 32 18 18 0 16 0 2 0 0 14 0
1780 17FF Khmer 高棉文 128 114 114 0 54 20 40 0 0 14 0
1800 18AF Mongolian 蒙古文 176 157 156 1 129 10 17 0 0 19 0
18B0 18FF Unified Canadian Aboriginal Syllabics Extended 统一加拿大原住民音节文字扩展 80 70 70 0 70 0 0 0 0 10 0
1900 194F Limbu 林布文 80 68 68 0 31 10 27 0 0 12 0
1950 197F Tai Le 德宏傣文 48 35 35 0 35 0 0 0 0 13 0
1980 19DF New Tai Lue 新傣仂文 96 83 83 0 70 11 2 0 0 13 0
19E0 19FF Khmer Symbols 高棉文符号 32 32 32 0 0 0 32 0 0 0 0
1A00 1A1F Buginese 布吉文 32 30 30 0 23 0 7 0 0 2 0
1A20 1AAF Tai Tham 老傣文 144 127 127 0 54 20 53 0 0 17 0
1AB0 1AFF Combining Diacritical Marks Extended 组合变音符号扩展 80 17 17 0 0 0 17 0 0 63 0
1B00 1B7F Balinese 巴厘字母 128 121 121 0 54 10 57 0 0 7 0
1B80 1BBF Sundanese 巽他字母 64 64 64 0 38 10 16 0 0 0 0
1BC0 1BFF Batak 巴塔克字母 64 56 56 0 38 0 18 0 0 8 0
1C00 1C4F Lepcha 雷布查字母 80 74 74 0 39 10 25 0 0 6 0
1C50 1C7F Ol Chiki 桑塔利语 48 48 48 0 36 10 2 0 0 0 0
1C80 1C8F Cyrillic Extended-C 西里尔文扩展C 16 9 9 0 9 0 0 0 9 7 0
1C90 1CBF Georgian Extended 格鲁吉亚文扩展 48 46 46 0 46 0 0 46 0 2 0
1CC0 1CCF Sundanese Supplement 巽他字母补充 16 8 8 0 0 0 8 0 0 8 0
1CD0 1CFF Vedic Extensions 吠陀梵文 48 43 43 0 13 0 30 0 0 5 0
1D00 1D7F Phonetic Extensions 语音学扩展 128 128 128 0 128 0 0 0 128 0 0
1D80 1DBF Phonetic Extensions Supplement 语音学扩展补充 64 64 64 0 64 0 0 0 64 0 0
1DC0 1DFF Combining Diacritical Marks Supplement 结合附加符号补充 64 63 63 0 0 0 63 0 0 1 0
1E00 1EFF Latin Extended Additional 拉丁文扩展附加 256 256 256 0 256 0 0 124 132 0 0
1F00 1FFF Greek Extended 希腊语扩展 256 233 233 0 218 0 15 69 122 23 0
2000 206F General Punctuation 常用标点 112 111 71 40 0 0 71 0 0 1 0
2070 209F Superscripts and Subscripts 上标及下标 48 42 42 0 15 17 10 0 15 6 0
20A0 20CF Currency Symbols
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值