\p{L}或\p{Letter}:来自任何语言的任何类型的字母。
\p{Ll}或\p{Lowercase_Letter}:具有大写变体的小写字母。
\p{Lu}或\p{Uppercase_Letter}:具有小写变体的大写字母。
\p{Lt}或\p{Titlecase_Letter}:当单词的首字母大写时,出现在单词开头的字母。
\p{L&}或\p{Cased_Letter}:以小写和大写形式存在的字母(Ll、Lu 和 Lt 的组合)。
\p{Lm}或\p{Modifier_Letter}:像字母一样使用的特殊字符。
\p{Lo}或\p{Other_Letter}:没有小写和大写变体的字母或表意文字。
\p{M}或\p{Mark}:旨在与另一个字符组合的字符(例如重音符号、变音符号、封闭框等)。
\p{Mn}或\p{Non_Spacing_Mark}:旨在与另一个字符组合而不占用额外空间的字符(例如重音符号、变音符号等)。
\p{Mc}或\p{Spacing_Combining_Mark}:旨在与占用额外空间的另一个字符组合的字符(许多东方语言中的元音符号)。
\p{Me}或\p{Enclosure_Mark}:一个字符,它包围了与之组合的字符(圆形、方形、键帽等)。
\p{Z}或\p{Separator}:任何类型的空格或不可见的分隔符。
\p{Zs}或\p{Space_Separator}:一个不可见但占用空间的空白字符。
\p{Zl}或\p{Line_Separator}:行分隔符 U+2028。
\p{Zp}或\p{Paragraph_Separator}:段落分隔符 U+2029。
\p{S}或\p{Symbol}:数学符号、货币符号、装饰符号、画框字符等。
\p{Sm}或\p{Math_Symbol}:任何数学符号。
\p{Sc}或\p{Currency_Symbol}:任何货币符号。
\p{Sk}或\p{Modifier_Symbol}:一个组合字符(标记)作为一个完整的字符。
\p{So}或\p{Other_Symbol}:不是数学符号、货币符号或组合字符的各种符号。
\p{N}或\p{Number}:任何脚本中的任何类型的数字字符。
\p{Nd}或\p{Decimal_Digit_Number}:除表意文字外的任何文字中的数字 0 到 9。
\p{Nl}或\p{Letter_Number}:一个看起来像字母的数字,例如罗马数字。
\p{No}或\p{Other_Number}:上标或下标数字,或不是数字 0-9 的数字(不包括表意文字中的数字)。
\p{P}或\p{Punctuation}:任何类型的标点符号。
\p{Pd}或\p{Dash_Punctuation}:任何类型的连字符或破折号。
\p{Ps}或\p{Open_Punctuation}:任何类型的左括号。
\p{Pe}或\p{Close_Punctuation}:任何类型的右括号。
\p{Pi}或\p{Initial_Punctuation}:任何类型的开场白。
\p{Pf}或\p{Final_Punctuation}:任何类型的结束引号。
\p{Pc}或\p{Connector_Punctuation}:一个标点符号,例如连接单词的下划线。
\p{Po}或\p{Other_Punctuation}:任何非破折号、括号、引号或连接符的标点符号。
\p{C}或\p{Other}:不可见的控制字符和未使用的代码点。
\p{Cc}或\p{Control}:ASCII 或 Latin-1 控制字符:0x00–0x1F 和 0x7F–0x9F。
\p{Cf}或\p{Format}:不可见的格式指示符。
\p{Co}或\p{Private_Use}:保留供私人使用的任何代码点。
\p{Cs}或\p{Surrogate}:UTF-16 编码中代理对的一半。
\p{Cn}或\p{Unassigned}:任何未分配字符的代码点。
Unicode正则匹配大全
最新推荐文章于 2024-04-27 09:13:51 发布