正则表达式之findall()方法——分组嵌套

基本语法

findall()方法返回一组字符串,包含被查找字符串中的“所有”匹配文本。

当正则表达式中没有分组,findall()方法返回一个字符串列表。列表中的每个字符串都是一段被查找的文本,它匹配该正则表达式。

>>> phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d') # 没有分组
>>> phoneNumRegex.findall('Cell: 415-555-9999 Work: 212-555-0000')
['415-555-9999', '212-555-0000']

如果在正则表达式中有分组,那么findall()方法将返回元组列表。每个元组表示一个找到的匹配,其中的项就是正则表达式中每个分组的匹配字符串。

>>> phoneNumRegex = re.compile(r'(\d\d\d)-(\d\d\d)-(\d\d\d\d)') # 有分组
>>> phoneNumRegex.findall('Cell: 415-555-9999 Work: 212-555-0000')
[('415', '555', '9999'), ('212', '555', '0000')]

分组嵌套

但是注意正则表达式的分组是可以嵌套的,也就是说当正则表达式是如下的形式(最外层加了一层括号):

'((\d\d\d)-(\d\d\d)-(\d\d\d\d))' #含主分组与子分组

我们将这种称之为有主分组与子分组的正则表达式,在这种情况下findall()方法会将其中符合主分组和子分组规则的部分全部保存在元组中。

>>> phoneNumRegex = re.compile(r'((\d\d\d)-(\d\d\d)-(\d\d\d\d))') # 分组嵌套
>>> test='Cell: 415-555-9999 Work: 212-555-0000'
>>> phoneNumRegex.findall(test)
[('415-555-9999', '415', '555', '9999'), ('212-555-0000', '212', '555', '0000')]

所以之后看到一些代码里使用findall()方法时,明明使用了分组却还是在输出中有整个匹配的部分的话,就得擦亮眼睛看看是不是进行了分组的嵌套啦。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值