正则表达式数量词是有贪婪和非贪婪之分的
默认情况下,python
正则表达式倾向于贪婪的匹配方式
如果把一个数量词限定在一个区间之内,python
就倾向于尽可能多的取这个区间最大的值
这里规定是3到6,它匹配到3个的时候呢,它并不会以为这个表达式是成立的,它还会继续往后去寻找,一直到某一个字符不满足它的条件(不在数量词的区间之内或者匹配的字符不满足字符集的条件)
时,它才会停止
import re
a = 'python 1234php567java'
r = re.findall('[a-z]{3,6}', a)
print(r)
---------------------------------------
输出:
['python', 'php', 'java']
非贪婪就是在数量词后面加上一个问号 {3,6}?
,这样就是以非贪婪的模式来匹配正则表达式
import re
a = 'python 1234php567java'
r = re.findall('[a-z]{3,6}?', a)
print(r)
--------------------------------
输出:
['pyt', 'hon', 'php', 'jav']
结果和{3}
是一样的。
所以,当程序的结果不满足我们的需求时,就要考虑到贪婪和非贪婪是否影响了。