re模块:findall()

findall():查询字符串中某个正则表达式模式全部的非重复出现情况。

一、正常匹配

  正则表达式不支持子组匹配

import re
s = 'This and that.'
p = re.compile(r'th\w+', re.I)  # 不区分大小写
print p.findall(s)
======================================
['This', 'that']
======================================

findall( ) 函数类似于 search( ) 函数,但与 match( ) 和 search( ) 的不同之处在于,findall( )总是返回一个列表
如果 findall( ) 没有找到匹配部分,就返回一个空列表,但如果匹配成功,列表将包含所有成功的匹配部分。

二、存在子组

  正则表达式支持子组匹配

import re
s = 'This and that.'
p = re.compile(r'(th\w+)', re.I)  # 不区分大小写
print "r'(th\w+)' result:", p.findall(s)

p = re.compile(r'(th(\w+))', re.I)
print "r'(th(\w+))' result:", p.findall(s)

p = re.compile(r'th(\w+)', re.I)
print "r'th(\w+)' result:".ljust(20), p.findall(s)
======================================
r'(th\w+)' result:   ['This', 'that']
r'(th(\w+))' result: [('This', 'is'), ('that', 'at')]
r'th(\w+)' result:   ['is', 'at']
======================================
1、r'(th\w+)'r'th\w+'

findall( )匹配到多个结果,并以字符串列表的形式返回;
正则表达式r'(th\w+)'中多存在一个子组匹配,但结果与r'th\w+'相同;
当表达式中存在子组时,匹配结果只返回子组匹配的结果;
当存在一个子组时,结果会以字符串列表的形式返回;

2、r'(th\w+)'r'(th(\w+))'

正则表达式r'(th(\w+))'中多存在一个子组匹配;
当存在多个子组时,结果会以元组列表的形式返回,每个元组保存多个子组匹配结果;

3、r'th(\w+)'r'th\w+'

当表达式中存在子组时,匹配结果只返回子组匹配的结果;
当存在一个子组时,结果会以字符串列表的形式返回;

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值