Unicode正则匹配大全

这篇博客详细介绍了Unicode字符类别在正则表达式中的使用,包括字母(如大小写字母、标题字母、其他字母)、标点符号、数字、符号、分隔符和其他特殊字符的表示方法。内容涵盖p{L}系列、p{M}系列、p{Z}系列、p{S}系列、p{N}系列和p{P}系列等,是理解Unicode正则匹配的重要参考资料。
摘要由CSDN通过智能技术生成

\p{L}或\p{Letter}:来自任何语言的任何类型的字母。
\p{Ll}或\p{Lowercase_Letter}:具有大写变体的小写字母。
\p{Lu}或\p{Uppercase_Letter}:具有小写变体的大写字母。
\p{Lt}或\p{Titlecase_Letter}:当单词的首字母大写时,出现在单词开头的字母。
\p{L&}或\p{Cased_Letter}:以小写和大写形式存在的字母(Ll、Lu 和 Lt 的组合)。
\p{Lm}或\p{Modifier_Letter}:像字母一样使用的特殊字符。
\p{Lo}或\p{Other_Letter}:没有小写和大写变体的字母或表意文字。
\p{M}或\p{Mark}:旨在与另一个字符组合的字符(例如重音符号、变音符号、封闭框等)。
\p{Mn}或\p{Non_Spacing_Mark}:旨在与另一个字符组合而不占用额外空间的字符(例如重音符号、变音符号等)。
\p{Mc}或\p{Spacing_Combining_Mark}:旨在与占用额外空间的另一个字符组合的字符(许多东方语言中的元音符号)。
\p{Me}或\p{Enclosure_Mark}:一个字符,它包围了与之组合的字符(圆形、方形、键帽等)。
\p{Z}或\p{Separator}:任何类型的空格或不可见的分隔符。
\p{Zs}或\p{Space_Separator}:一个不可见但占用空间的空白字符。
\p{Zl}或\p{Line_Separator}:行分隔符 U+2028。
\p{Zp}或\p{Paragraph_Separator}:段落分隔符 U+2029。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值