正则表达式的multiline和dotall模式
一、multiline模式
如果regexp里出现了^或者$,那么by default只会匹配第一行,设置了Multiline,会匹配所有行。所以,在regexp里出现了^$, Multiline才有意思, 否则是没有意义的。
1.1 在线工具测试
使用这个在线网址测试
http://regexpal.com.s3-website-us-east-1.amazonaws.com/
测试文本
abcBBBdef
sdfAAAfff
sdf
用如下正则来匹配上面的测试文本
# 默认情况下,正则只作用于第一行
# multiline模式下,才会作用于所有行
^.*AAA.*$
默认情况下
multiline模式下
1.2 Python测试
m.py
import re
src = 'abcBBBdef\nsdfAAAfff\nsdf'
print(src)
print('-----------------')
print(re.search('^.*AAA.*$', src))
print(re.search('^.*AAA.*$', src, flags=re.M).group())
结果
二、dotall模式
默认情况下,.不会匹配换行符,设置了Dotall模式,.会匹配所有字符包括换行符。
2.1 在线工具测试
默认情况下
dotall模式下
2.2 Python测试
s.py
import re
src = 'abcBBBdef\nsdfAAAfff\nsdf'
print(src)
print('-----------------')
print(re.search('BBB.*AAA', src))
print(re.search('BBB.*AAA', src, flags=re.S).group())
执行结果