正则表达式高级

最新推荐文章于 2024-05-10 09:38:05 发布

SurgeOfLove

最新推荐文章于 2024-05-10 09:38:05 发布

阅读量865

点赞数 2

分类专栏： cixz

本文链接：https://blog.csdn.net/qhairen/article/details/81563252

版权

cixz 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

零宽断言

小括号的作用
分类　　　　代码/语法　　　　说明
捕获　　　　
　　　　　　(exp) 　　　　　　匹配exp,并捕获文本到自动命名的组里
　　　　　　(?<name>exp) 　匹配exp,并捕获文本到名称为name的组里，也可以写成(?'name'exp)
　　　　　　(?:exp) 　　　　   匹配exp,不捕获匹配的文本，也不给此分组分配组号
零宽断言
　　　　　　(?=exp) 　　　　匹配exp前面的位置
　　　　　　(?<=exp) 　　　  匹配exp后面的位置
　　　　　　(?!exp) 　　　　  匹配后面跟的不是exp的位置
　　　　　　(?<!exp) 　　　　匹配前面不是exp的位置
注释
　　　　　　(?#comment) 这种类型的分组不对正则表达式的处理产生任何影响，用于提供注释让人阅读
要特别注意的是，零宽断言是不占用位置的，也就是说，匹配结果里是不会返回它的。（\b ^ $ 也是零宽断言，正则一种是匹配位置，一种是匹配字符）

懒惰匹配（默认是贪婪匹配，即+）

代码/语法　　　　　　说明
*? 　　　　　　　　　重复任意次，但尽可能少重复
+? 　　　　　　　　　重复1次或更多次，但尽可能少重复
?? 　　　　　　　　　重复0次或1次，但尽可能少重复
{n,m}? 　　　　　　重复n到m次，但尽可能少重复
{n,}? 　　　　　　　重复n次以上，但尽可能少重复

平衡组
正则表达式平衡组用于匹配左右两边开始，结束符号相等数量的内容
　　例如，对于字符串"xx <aa <bbb> <bbb> aa> yy>" 左右两边的< > 是不等的，如果简单的<.+>匹配到的是最外层的开始括号<与结束括号
>之间的内容，但是开始和封闭的括号数量不一致。如果你希望匹配到的是左右括号正常结束的字符串，那么就需要用到平衡组了。
平衡组语法：
　　(?'group') 把捕获的内容命名为group,并压入堆栈(Stack)
　　(?'-group') 从堆栈上弹出最后压入堆栈的名为group的捕获内容，如果堆栈本来为空，则本分组的匹配失败
　　(?(group)yes|no) 如果堆栈上存在以名为group的捕获内容的话，继续匹配yes部分的表达式，否则继续匹配no部分
　　(?!) 零宽负向先行断言，由于没有后缀表达式，试图匹配总是失败

<div[^>]*>
[^<>]*
(
   (
       (?'Open'<div[^>]*>)
       [^<>]*
)+
   (
       (?'-Open'</div>)
       [^<>]*
   )+
)*
(?(Open)(?!))
</div>