贪婪与非贪婪
首先,使用“{m,n}”、“{m,}”、“?”、“*”和“+”这些字符在正则表达式中都会默认使用贪婪模式,而在这些字符后面加上一个?会变成非贪婪模式。比如*?
那么,贪婪模式和非贪婪模式的区即是,*的原意是可以匹配零次及零次以上,那么到底匹配的时候是选取0次还是一次还是两次呢。贪婪就表现在选取最多的次数。比如下列代码
import re
string = "aaaaaaa"
m = re.findall("a*", string)
print(m)
这里的m打印出来的结果取a的最多次,即七个a。非贪婪即截取最少的次数
findall()函数中括号的作用
该函数中的()可以使返回值为括号里面的表达式,即
string = ("abbsbaaaacs")
m = re.findall("a(.*?)s", string)
这次findall返回的内容是括号里表达式匹配到的内容,即表达式.*?匹配到的内容,即'bb'和'aaac'
如果有多个括号,则会以元组的形式,返回每个括号里正则表达式所匹配到的内容