正则表达式断言

1. 何为断言

断言表示为一些布尔表达式 -度娘百科

在正则表达式中,断言的作用就是限制某个字符串应该满足的条件,而断言自身并不会匹配

2. 正则表达式中使用断言的场景

  • 匹配<title>xxx</title>中的xxx,而不匹配<title></title>,所以不能使用<title>.*</title>这个表达式。
  • 匹配以re开头的单词,不过不能是regex
  • balabala……
    总之就是如果某个位置需要满足某种条件时就可以使用断言~

3. 断言的种类

这部分可以围观大佬的博客=。=,对四种断言的介绍摘抄自该博客~
断言分为以下四种:

  • (?=pattern)零宽正向先行断言
    代表字符串中的一个位置,紧接该位置之后的字符序列能够匹配pattern。
    例如对”a regular expression”这个字符串,要想匹配regular中的re,但不能匹配expression中的re,可用re(?=gular),该表达式限定了re右边的位置,这个位置之后是gular,但并不消耗gular这些字符,将表达式改为re(?=gular).,将会匹配reg,元字符.匹配了g,断言处于e和g之间的位置。
  • (?<=pattern)零宽正向后行断言
    代表字符串中的一个位置,紧接该位置之前的字符序列能够匹配pattern。
    例如对”regex represents regular expression”这个字符串,有4个单词,要想匹配单词内部的re,但不匹配单词开头的re,可以用(?<=\w)re,单词内部的re,在re前面应该是一个单词字符。之所以叫后行断言,是因为正则表达式引擎在匹配字符串和表达式时,是从前向后逐个扫描字符串中的字符,并判断是否与表达式符合,当在表达式中遇到该断言时,正则表达式引擎需要往字符串前端检测已扫描过的字符,相对于扫描方向是向后的。
  • (?!pattern)零宽负向先行断言
    代表字符串中的一个位置,紧接该位置之后的字符序列不能匹配pattern。
    例如对”regex represents regular expression”这个字符串,要想匹配除regex和regular之外的re,可以用re(?!g),该表达式限定了re右边的位置,这个位置后面不是字符g。负向和正向的区别,就在于该位置之后的字符能否匹配括号中的表达式。
  • (?<!pattern)零宽负向后行断言
    代表字符串中的一个位置,紧接该位置之前的字符序列不能匹配pattern。
    例如对”regex represents regular expression”这个字符串,要想匹配单词开头的re,可以用(?<!\w)re。单词开头的re,在本例中,也就是指不在单词内部的re,即re前面不是单词字符。当然也可以用\bre来匹配。

这些名字看着非常难以理解,所以在下面提供了解释,不求看完就理解,能提供点印象就不错~

  • 零宽:我的理解就是断言是一个位置的条件,本身不匹配,所以是零宽
  • 正/负向:满足/不满足提供的pattern
  • 先/后行:正则表达式引擎在遇到断言时,需要向前还是向后判断(从左向右为向前)

其实断言本身很好理解,不过“x向”、“x行”等各种名词,导致名称非常复杂,所以才比较难理解。名字可以先忽略,理解了各个表达式之后可以再去记名字。

4. 几个需要注意的点

  1. 断言的中的pattern不会匹配,断言仅仅是一个条件。
  2. 断言所代表的是一个位置的条件,而不是某个字符串的条件。

5. 测试

看完了众多大神的博客,应该也是理解的差不多了=。=,看几个正则表达式来验证下是否真正理解了吧~
1. (?<=\bre)\b这个pattern有什么错误?这个pattern仅包含了一个条件和一个\b,所以是错的
2. \w+(?<=\bre)\w+\b这个断言限制的是哪个\w+的内容?这个断言的含义为:断言位置之前的字符串需要满足\bre这个pattern,限制的是第二个\w前面的内容,与两个\w的匹配到的内容都无关//好吧我自己也很纠结
3. 用\w+(?<=\bre)\w+\b匹配”aa reaaa”,最终的结果是什么?最终的结果为”reaaa”,不是说断言作为条件不会匹配么,为什么re最后也出现了?因为这个pattern包含两个\w+,aaa是满足断言的\w+匹配到的内容,re是第一个\w匹配到的内容

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值