正则表达式是一种模式匹配,通常被用来检索、替换那些符合某个模式(规则)的文本,非常好用,但是,有时间正则表达式很难“停”下来,因为这种模式匹配常常是贪婪的。
今天就来介绍一种让正则表达式“停”下了的方法。
line = "aabcccceebbb12345"
对这个字符串取bcccceeb。那么我们通常会用正则表示进行贪婪匹配,但是,稍不注意就会取成“bb”。
例如下面:
reg_str = '.*(b.*b).*'
mat = re.match(reg_str, line)
if mat:
print(match_obj.group(1))
输出就为:
bb
怎么修改一下能变得不贪婪呢?
通过特殊符号:“?”
reg_str = '.*?(b.*?b).*'
mat = re.match(reg_str, line)
if mat:
print(match_obj.group(1))
在匹配的时候,添加一个“.*?”,表示遇到问号后面的字符就停止搜索。这是平日时间里的遇到的一个问题,在此做下笔记,以防忘记。。