本文为正则支持的字符类附录列表。
具体的Go支持的正则规则请参考:Go语言支持的正则语法
perl 类
符号 | 意义 |
---|
\d | 数字 (相当于 [0-9]) |
\D | 非数字 (相当于 [^0-9]) |
\s | 空白 (相当于 [\t\n\f\r ]) |
\S | 非空白 (相当于[^\t\n\f\r ]) |
\w | 单词字符 (相当于 [0-9A-Za-z_]) |
\W | 非单词字符 (相当于 [^0-9A-Za-z_]) |
ascii 类
符号 | 意义 |
---|
[:alnum:] | 字母数字 (相当于 [0-9A-Za-z]) |
[:alpha:] | 字母 (相当于 [A-Za-z]) |
[:ascii:] | ASCII 字符集 (相当于 [\x00-\x7F]) |
[:blank:] | 空白占位符 (相当于 [\t ]) |
[:cntrl:] | 控制字符 (相当于 [\x00-\x1F\x7F]) |
[:digit:] | 数字 (相当于 [0-9]) |
[:graph:] | 图形字符 (相当于 [!-~]) |
[:lower:] | 小写字母 (相当于 [a-z]) |
[:print:] | 可打印字符 (相当于 [ -~] 相当于 [ [:graph:]]) |
[:punct:] | 标点符号 (相当于 [\:-@!-/[-反引号{-~] ) |
[:space:] | 空白字符(相当于 [\t\n\v\f\r ]) |
[:upper:] | 大写字母(相当于 [A-Z]) |
[:word:] | 单词字符(相当于 [0-9A-Za-z_]) |
[:xdigit:] | 16 進制字符集(相当于 [0-9A-Fa-f]) |
unicode 字符类(one-letter)
语法 | 说明 |
---|
C | -其他- (other) |
Cc | 控制字符 (control) |
Cf | 格式 (format) |
Co | 私人使用区 (private use) |
Cs | 代理区 (surrogate) |
L | -字母- (letter) |
Ll | 小写字母 (lowercase letter) |
Lm | 修饰字母 (modifier letter) |
Lo | 其它字母 (other letter) |
Lt | 首字母大写字母 (titlecase letter) |
Lu | 大写字母 (uppercase letter) |
M | -标记- (mark) |
Mc | 间距标记 (spacing mark) |
Me | 关闭标记 (enclosing mark) |
Mn | 非间距标记 (non-spacing mark) |
N | -数字- (number) |
Nd | 十進制数字 (decimal number) |
Nl | 字母数字 (letter number) |
No | 其它数字 (other number) |
P | -标点- (punctuation) |
Pc | 连接符标点 (connector punctuation) |
Pd | 破折号标点符号 (dash punctuation) |
Pe | 关闭的标点符号 (close punctuation) |
Pf | 最后的标点符号 (final punctuation) |
Pi | 最初的标点符号 (initial punctuation) |
Po | 其他标点符号 (other punctuation) |
Ps | 开放的标点符号 (open punctuation) |
S | -符号- (symbol) |
Sc | 货币符号 (currency symbol) |
Sk | 修饰符号 (modifier symbol) |
Sm | 数学符号 (math symbol) |
So | 其他符号 (other symbol) |
Z | -分隔符- (separator) |
Zl | 行分隔符 (line separator) |
Zp | 段落分隔符 (paragraph separator) |
Zs | 空白分隔符 (space separator) |
unicode 字符类
语法 | 说明 |
---|
Arabic | 阿拉伯文 |
Armenian | 亚美尼亚文 |
Balinese | 巴厘岛文 |
Bengali | 孟加拉文 |
Bopomofo | 汉语拼音字母 |
Braille | 盲文 |
Buginese | 布吉文 |
Buhid | 布希德文 |
Canadian_Aboriginal | 加拿大土著文 |
Carian | 卡里亚文 |
Cham | 占族文 |
Cherokee | 切诺基文 |
Common | 普通的,字符不是特定于一个脚本 |
Coptic | 科普特文 |
Cuneiform | 楔形文字 |
Cypriot | 塞浦路斯文 |
Cyrillic | 斯拉夫文 |
Deseret | 犹他州文 |
Devanagari | 梵文 |
Ethiopic | 衣索比亚文 |
Georgian | 格鲁吉亚文 |
Glagolitic | 格拉哥里文 |
Gothic | 哥特文 |
Greek | 希腊 |
Gujarati | 古吉拉特文 |
Gurmukhi | 果鲁穆奇文 |
Han | 汉文 |
Hangul | 韩文 |
Hanunoo | 哈鲁喏文 |
Hebrew | 希伯来文 |
Hiragana | 平假名(日语) |
Inherited | 继承前一个字符的脚本 |
Kannada | 坎那达文 |
Katakana | 片假名(日语) |
Kayah_Li | 克耶字母 |
Kharoshthi | 卡罗须提文 |
Khmer | 高棉文 |
Lao | 老挝文 |
Latin | 拉丁文 |
Lepcha | 雷布查文 |
Limbu | 林布文 |
Linear_B | B类线形文字(古希腊) |
Lycian | 利西亚文 |
Lydian | 吕底亚文 |
Malayalam | 马拉雅拉姆文 |
Mongolian | 蒙古文 |
Myanmar | 缅甸文 |
New_Tai_Lue | 新傣仂文 |
Nko | Nko文 |
Ogham | 欧甘文 |
Ol_Chiki | 桑塔利文 |
Old_Italic | 古意大利文 |
Old_Persian | 古波斯文 |
Oriya | 奥里亚文 |
Osmanya | 奥斯曼亚文 |
Phags_Pa | 八思巴文 |
Phoenician | 腓尼基文 |
Rejang | 拉让文 |
Runic | 古代北欧文字 |
Saurashtra | 索拉什特拉文(印度县城) |
Shavian | 萧伯纳文 |
Sinhala | 僧伽罗文 |
Sundanese | 巽他文 |
Syloti_Nagri | 锡尔赫特文 |
Syriac | 叙利亚文 |
Tagalog | 塔加拉文 |
Tagbanwa | 塔格巴努亚文 |
Tai_Le | 德宏傣文 |
Tamil | 泰米尔文 |
Telugu | 泰卢固文 |
Thaana | 塔安那文 |
Thai | 泰文 |
Tibetan | 藏文 |
Tifinagh | 提非纳文 |
Ugaritic | 乌加里特文 |
Vai | 瓦伊文 |
Yi | 彝文 |
完!
原文出自:小韩说课
微信关注:小韩说课