当python正则表达式中有“?”时,直接匹配会得不到正确的结果。比如这个例子:
import re
dd = r'sgsw?ccgsgsw?cwwww'
c = 'w?c'
f = re.findall(c,dd)
print(f)
本来是想找到dd中所有“w?c”的子串,结果发现执行出来的结果不是我们想要的,是下面这个:
[‘c’, ‘c’, ‘c’]
为什么呢?
问题就出在这个“?”上,“?”是元字符,是有特殊含义的。在正则表达式里面意思是匹配0个或多个问号前面的字符,这里就是匹配任意个w加c,上面的dd中没有任意个w加c的字符串,只有w?c的字符串,所以就认为匹配了0个w加c,出来的结果就是3个c。
那怎么才能得到我们想要的结果呢?解决办法就是要把正则表达式中的"?"转换为普通的字符,自然就是使用转义字符“\”。
import re
dd = r'sgsw?ccgsgsw?cwwww'
c = 'w?c'
c=re.sub(r'\?','\?',c)
f = re.findall(c,dd)
print(f)
[‘w?c’, ‘w?c’]
至此,我们得到了想要的结果。
综上,我们在使用正则表达式的时候一定要小心元字符,如果是想把元字符作为一个普通字符使用的话,一定记得前面加上转义字符。