正则表达式 捕获型括号和非捕获型括号
对于括号中的子表达式,正则表达式会将匹配的子表达式进行存储。
问题描述
import re
PATH='/Users/Michael/.../app_stat.sh'
CREATE_PATT = '.*?exists.*?(\w+(_\w+)+)\('
with open(PATH) as fr:
content = fr.read()
createPatt = re.compile(CREATE_PATT)
tables = re.findall(createPatt, content)
print tables
结果如下:
[('mds_anti_app_stat', '_stat'), ('mds_anti_app_blacklist', '_blacklist'), ('mds_anti_app_mail', '_mail'), ('mds_anti_app_few_follow', '_follow'), ('mds_anti_app_mail_spamfan', '_sp
amfan')]
很显然,我想要的结果是
['mds_anti_app_stat', 'mds_anti_app_blacklist', 'mds_anti_app_mail', 'mds_anti_app_few_follow', 'mds_anti_app_mail_spamfan']
由于
(_\w+)+
夹杂这一个括号,导致多匹配了一个结果。
解决方案
将 (_\w+)+
改为 (?:w+)+