正则表达式高级

零宽断言

小括号的作用
分类     代码/语法     说明
捕获    
      (exp)        匹配exp,并捕获文本到自动命名的组里
      (?<name>exp)   匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)
      (?:exp)        匹配exp,不捕获匹配的文本,也不给此分组分配组号
零宽断言 
      (?=exp)      匹配exp前面的位置
      (?<=exp)      匹配exp后面的位置
      (?!exp)       匹配后面跟的不是exp的位置
      (?<!exp)     匹配前面不是exp的位置
注释 
      (?#comment) 这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读
要特别注意的是,零宽断言是不占用位置的,也就是说,匹配结果里是不会返回它的。(\b ^ $ 也是零宽断言,正则一种是匹配位置,一种是匹配字符)

懒惰匹配(默认是贪婪匹配,即+)

代码/语法       说明
*?          重复任意次,但尽可能少重复
+?          重复1次或更多次,但尽可能少重复
??           重复0次或1次,但尽可能少重复
{n,m}?         重复n到m次,但尽可能少重复
{n,}?          重复n次以上,但尽可能少重复


平衡组
正则表达式平衡组用于匹配左右两边开始,结束符号相等数量的内容
  例如,对于字符串"xx <aa <bbb> <bbb> aa> yy>" 左右两边的< > 是不等的,如果简单的<.+>匹配到的是最外层的开始括号<与结束括号 
>之间的内容,但是开始和封闭的括号数量不一致。如果你希望匹配到的是左右括号正常结束的字符串,那么就需要用到平衡组了。
平衡组语法:
  (?'group') 把捕获的内容命名为group,并压入堆栈(Stack)
  (?'-group') 从堆栈上弹出最后压入堆栈的名为group的捕获内容,如果堆栈本来为空,则本分组的匹配失败
  (?(group)yes|no) 如果堆栈上存在以名为group的捕获内容的话,继续匹配yes部分的表达式,否则继续匹配no部分
  (?!) 零宽负向先行断言,由于没有后缀表达式,试图匹配总是失败

 

 

 


<div[^>]*>
[^<>]*
(
    (
        (?'Open'<div[^>]*>)
        [^<>]*
  )+
    (
        (?'-Open'</div>)
        [^<>]*
    )+
)*
(?(Open)(?!))
</div>


 

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值