Python3正则表达式之:(?(id/name)yes-pattern|no-pattern)条件性匹配

转自:https://www.weidianyuedu.com/

Python3正则表达式之:(?(id/name)yes-pattern|no-pattern)条件性匹配

  1. 用途
    (?(id/name)yes-pattern|no-pattern)的作用是:

对于给出的id或者name,先尝试去匹配 yes-pattern部分的内容;

如果id或name条件不满足,则去匹配no-pattern部分的内容;

这句话听着还是很拗口的,或者说一下子还是很难懂的。

  1. 参数含义
    此处的name或id,是针对(当前位置的)条件性匹配之前的,某个已经通过group去分组的内容

name: 如果是有命名的分组,即named group,则对应的该分组就有对应的name,即此处所指的就是对应的name;

id: 如果是无命名的分组,即unnamed group,则对应的该分组也有对应的分组的编号,称为group的number,也叫做id,对应的就是这里的id;

yes-pattern: 如果前面的group匹配成功,则此处,就执行yes-pattern的匹配;

no-pattern: 如果前面group匹配不成功,即没有找到符合该的group内容,则就匹配no-pattern;

注意: 上面的yes-pattern和no-pattern,都是普通的正则表达式,用来匹配所需的内容。

  1. 语法
    如果存在no-pattern,则前面要有个竖杠’|’,用来分隔yes-pattern和no-pattern

如果不想匹配no-pattern的部分,则可以连同’|'一起不写。

实例:

re.search(r’(\d+)?(?(1)\w+|pythontab.\w+)‘, ‘pythontab.com’)>>> re.search(r’(\d+)?(?(1)\w+)', ‘100pythontab’)

其中的?(1)代表序号为1的group, 也就是上面(\d+), 第二个表达式中就没有使用no-pattern

  1. 用法详解
    还是上面的例子, 我们变换一下, 用实例探索它们的详细用法及技巧

4.1 把(\d+)后面的问号去掉, 也就是说必须存在group 1,不是可有可无

执行:

re.search(r’(\d+)(?(1)\w+|pythontab.\w+)', ‘pythontab.com’)

整体规则匹配失败,返回为空,no-pattern部分并没有按照预想执行。

4.2 改一下匹配字符串https://www.weidianyuedu.com/

re.search(r’(\d+)(?(1)\w+|pythontab.\w+)', ‘1pythontab.com’)
可以匹配到, group1和yes部分都匹配到了

4.3 group可有可无的情况(group后增加问号)

re.search(r’(\d+)?(?(1)\w+|pythontab.\w+)', ‘pythontab’)

如果group没有匹配到,且它可有可无, 那么group会被认为匹配不成功,继续执行no-pattern部分匹配

4.4 只匹配group 1 部分, yes部分没有匹配

re.search(r’(\d+)(?(1)\w+|pythontab.\w+)', ‘1000’)
只匹配group 1 部分, yes部分没有匹配,也是有匹配结果的, 那说明yes-pattern和no-pattern不一定必须匹配成功

5.结论

  1. 通过4.1 4.2 4.3 对比可以发现:

当该特殊规则中的作为判断条件的组本身不允许为空的时候,在该组对目标字符串匹配为空的情况下,整体规则匹配失败,所以后面的作为整体一部分的特殊规则自然也就无效了。所以要想特殊规则的no-pattern生效,必须判断条件对应组匹配数可以为0。

  1. 通过4.4可知:可以仅匹配group部分, 如果yes-pattern和no-pattern没有匹配到, 则会仅输出group匹配的内容
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 正则表达式"(?=[\x21-\x7e] )"是一个先行断言的正则表达式,用于匹配一个后面跟着一个可打印ASCII字符的空格。下面是对这个正则表达式的说明: - (?=)是正则表达式中的一个特殊语法,表示正向先行断言。它指定了一个位置,只有当接下来的字符符合某个模式时,才会进行匹配。 - [\x21-\x7e]是一个字符类,包含了从ASCII值为\x21(十进制为33,对应"!")到ASCII值为\x7e(十进制为126,对应"~")之间的所有可打印ASCII字符。 - 由于(?=[\x21-\x7e] )使用了正向先行断言,意味着它只匹配一个后面跟着可打印ASCII字符的空格,而不会包括这个可打印ASCII字符本身。这个空格可以是任何标准空格字符,比如空格、制表符、换行符等。 举个例子,如果我们有一个字符串"Hello World!",正则表达式"(?=[\x21-\x7e] )"将会匹配到字符串中的空格字符。但它不会匹配到字符串中的"H"、"e"、"l"、"o"等可打印ASCII字符,因为它们不是空格。同样地,它也不会匹配到字符串中的"!",因为它不是一个可打印的ASCII字符。 需要注意的是,正则表达式中的空格字符是必须的,因为它是整个模式的一部分。如果我们省略空格,那么这个正则表达式将变成"(?=[\x21-\x7e])",表示匹配一个后面跟着可打印ASCII字符的位置,而不是匹配一个由空格分隔的可打印ASCII字符。 ### 回答2: 正则表达式"(?=[\x21-\x7e] )"的含义是进行正向预查。正向预查是一种非捕获型分组,用于在匹配结果之前进行条件判断。在这个正则表达式中,预查的条件匹配任意一个可见的ASCII字符(从十进制33到十进制126,即\x21到\x7e之间的字符),然后跟上一个空格。 这个正则表达式的作用是查找并匹配在任意一个可见的ASCII字符(包括标点符号、数字和字母)后面紧跟一个空格的字符。这个正则表达式可以用于从文本中提取出符合这个条件的字符、单词或字符串。 举个例子,如果我们有一个文本字符串:"Hello World!",这个正则表达式匹配到"o "和"d ",因为它们分别是字符"o"和"d"后面跟一个空格的情况。而"o"后面没有空格," "后面也没有字符,所以它们不会被匹配。 总的来说,正则表达式"(?=[\x21-\x7e] )"用于匹配任意一个可见的ASCII字符后面紧跟一个空格的情况,并从文本中提取出符合这个条件的字符、单词或字符串。 ### 回答3: 正则表达式"(?=[\x21-\x7e] )"表示一个正向预查,它用于匹配字符集合[\x21-\x7e]后面紧跟一个空格的位置。 在这个正则表达式中,[\x21-\x7e]代表ASCII表中可打印字符的范围,从十六进制值0x21到0x7e。这个范围包括了数字、大小写字母和一些特殊字符,如标点符号。 (?=[\x21-\x7e] )则是一个正向预查,它指定了一个条件,即所匹配的位置后面必须紧跟一个空格。但正向预查不会消耗输入字符串,因此匹配结果仅为位置而不包含具体的字符。 举个例子,如果有一个字符串"Hello World!",正则表达式"(?=[\x21-\x7e] )"将会匹配这个字符串中的空格位于可打印字符后面的位置。也就是说,它将会匹配"Hello "中的空格,但不会匹配空格后面的"World!"。 这个正则表达式的应用场景有很多,比如你可以用它来查找一个句子中的单词后面是否紧跟着一个空格,或者检查一个用户输入的密码是否满足复杂度要求(比如至少包含一个特殊字符后面紧跟一个空格)等等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值