python之re提取字符串中括号内的内容
代码如下:import re
string = "abe(ac)ad)"
p1 = re.compile(r"[(](.*?)[)]", re.S) #最小匹配
p2 = re.compile(r"[(](.*)[)]", re.S) #贪婪匹配
print(re.findall(p1, string))
print(re.findall(p2, string)
["ac"]
["ac)ad"]
解释一下:
1.正则匹配串前加了r就是为了使得里面的特殊符号不用写反斜杠了。
2.[ ]具有去特殊符号的作用,也就是说[(]里的(只是平凡的括号
3.正则匹配串里的()是为了提取整个正则串中符合括号里的正则的内容
4. .是为了表示除了换行符的任一字符。*克林闭包,出现0次或无限次。
5. 加了?是最小匹配,不加是贪婪匹配。
6. re.S是为了让.表示除了换行符的任一字符。
re.S解释:
re.S表示“.”(不包含外侧双引号,下同)的作用扩展到整个字符串,包括“ ”
正则表达式中,“.”的作用是匹配除“ ”以外的任何字符,也就是说,它是在一行中进行匹配。这里的“行”是以“ ”进行区分的。a字符串有每行的末尾有一个“ ”,不过它不可见。
如果不使用re.S参数,则只在每一行内进行匹配,如果一行没有,就换下一行重新开始,不会跨行。而使用re.S参数以后,正则表达式会将这个字符串作为一个整体,将“ ”当做一个普通的字符加入到这个字符串中,在整体中进行匹配。