\p{L}或\p{Letter}:来自任何语言的任何类型的字母。
\p{Ll}或\p{Lowercase_Letter}:具有大写变体的小写字母。
\p{Lu}或\p{Uppercase_Letter}:具有小写变体的大写字母。
\p{Lt}或\p{Titlecase_Letter}:当单词的首字母大写时,出现在单词开头的字母。
\p{L&}或\p{Cased_Letter}:以小写和大写形式存在的字母(Ll、Lu 和 Lt 的组合)。
\p{Lm}或\p{Modifier_Letter}:像字母一样使用的特殊字符。
\p{Lo}或\p{Other_Letter}:没有小写和大写变体的字母或表意文字。
\p{M}或\p{Mark}:旨在与另一个字符组合的字符(例如重音符号、变音符号、封闭框等)。
\p{Mn}或\p{Non_Spacing_Mark}:旨在与另一个字符组合而不占用额外空间的字符(例如重音符号、变音符号等)。
\p{Mc}或\p{Spacing_Combining_Mark}:旨在与占用额外空间的另一个字符组合的字符(许多东方语言中的元音符号)。
\p{Me}或\p{Enclosure_Mark}:一个字符,它包围了与之组合的字符(圆形、方形、键帽等)。
\p{Z}或\p{Separator}:任何类型的空格或不可见的分隔符。
\p{Zs}或\p{Space_Separator}:一个不可见但占用空间的空白字符。
\p{Zl}或\p{Line_Separator}:行分隔符 U+2028。
\p{Zp}或\p{Paragraph_Separator}:段落分隔符 U+2029。
Unicode正则匹配大全
最新推荐文章于 2024-07-27 17:56:15 发布
![](https://img-home.csdnimg.cn/images/20240711042549.png)