Python re模块与正则表达式
一、语法模式
先进行预编译,之后进行匹配
import re
data = ''
r = re.compile(r'pattern')
r.match(data)
直接根据规则匹配
import re
data = ''
re.match(r'pattern', data)
二、常用处理函数
findall(rule , target [,flag] ) # 在目标字符串中查找符合规则的字符串。
match() # 决定 RE 是否在字符串刚开始的位置匹配
search() # 扫描字符串,找到这个 RE 匹配的位置
findall() # 找到 RE 匹配的所有子串,并把它们作为一个列表返回
finditer() # 找到 RE 匹配的所有子串,并把它们作为一个迭代器返回
compile( rule [,flag] ) # 将正则规则编译成一个Pattern对象,以供接下来使用第一个参数
sub() # 根据规则替换字符串中的子串
subn()
split() # 分割字符串
purge()
escape() # 使字符串不以re的方式进行解析,而是以解释器的方式进行解析(逃出re)
fullmatch() #
group() # 返回被 RE 匹配的字符串
start() # 返回匹配开始的位置
end() # 返回匹配结束的位置
span() # 返回一个元组包含匹配 (开始,结束) 的位置
三、元字符
1.常用的元字符
2.常用的限定符号
3.常用的反义代码
4.分组语法
5.懒惰限定符
6.其他