正则表达式获取括号里面的_一日一技:一个括号两种意思,正则表达式奇怪的小括号...

54989e3418af14d3e8126b79b5b90e03.png

在Python里面,当我们要从一段正则表达式中提取出一部分内容的时候,我们可以把这部分内容用小括号包起来。例如:从字符串 我的密码123456abc中提取 123456abc,我们可以这样写正则表达式:

import re

s = '我的密码123456abc'

password = re.findall('密码(.*?)$', s)

print(password)

运行效果如下图所示:

5be07ab2eefd0cbdb47931cac6372b95.png

在这个例子里面,小括号的意思是“分组”。

但是,在正则表达式里面,小括号还有另外一个意思,那就是把几个符号放在一起,作为一个整体。

例如,还有另一个字符串 我的口令123456abc,这里密码前面是 口令,为了使用同一个正则表达式来从这两个句子里面提取密码,那么需要表达 密码或口令(.*?)$这个意思。

但如果我们这样写:

密码|口令(.*?)$

它实际上表达的意思是 密码令(.*?)$或者 密口令(.*?)$

所以我们需要把 (密码)口令作为整体来看待。此时,正则表达式本身支持使用括号来表示:

(密码|口令)(.*?)$

在正则表达式里面,小括号内部的 |左右两侧的多个字符串会作为整体,这样就能表示 密码(.*?)$口令(.*?)$了。

但是,正则表达式里面作为整体的小括号,与Python里面用来分组的小括号发生了冲突,于是我们会发现提取出来的内容并不是我们想要的:

de73a53ec90aa3671183290b5a130cfc.png

可以看到,这里, (密码|口令)它同时即有正则表达式里面作为整体的功能,又有Python里面分组的功能。于是结果就多出来了我们不想要的东西。

那么有什么办法让 (密码|口令)只实现正则表达式里面的作为整体的功能,不实现Python里面的分组功能呢?这个时候就需要使用正则表达式里面的一个组合符号 ?:了。

请大家对比下面三个结果:

b7c4612d9d5b2d11dae1bad30fe3d8a7.png

可以看到, >.*?<的作用是一样的。这就说明,以 ?:开头的小括号,它失去了分组的功能。

因此,我们把这个特征用到一开始的例子中:

>>> import re

>>> s = '我的密码123456abc'

>>> re.findall('(?:密码|口令)(.*?)$', s)

['123456abc']

>>> s = '我的口令123456abc'

>>> re.findall('(?:密码|口令)(.*?)$', s)

['123456abc']

运行效果如下图所示,完成任务:

41340bb203377014a5326702139d472f.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值