re模块的使用
import re
pattern = re.compile(
r'正则表达式', # r表示按原样输出
'匹配模式', # 可以不指定
)
正则匹配模式:
re.S # 可以匹配换行符
re.I # 忽略大小写
pattern对象的方法:
match, search, findall,finditer
使用方法:
match = pattern.match( # match, search, findall, finditer
string, # 匹配的目标字符串
start, # 匹配目标字符串的起始位置(可选)
end # 匹配目标字符串的结束位置(可选)
)
match方法:
默认从头开始匹配, 只匹配一次
search方法:
全文匹配, 匹配多次,将第一次匹配成功的数据返回
match和search方法返回Match对象
Match对象的方法:
match.group() # == match.group(0) 返回匹配结果内容
match.span() # 匹配范围
match.start() # 匹配起始位置
match.end() # 匹配结束位置
findall方法:
全文匹配, 匹配多次,将匹配成功的所有数据返回,返回对象是一个列表
finditer方法:
全文匹配, 匹配多次, 返回一个迭代器, 迭代器里面存储的是match对象
split方法:
按正则方法表示内容进行分割字符串, 返回分割后的list
pattern.split(
String, # 需要分割的字符串
Maxsplit # 指定最大分隔次数,默认全部分隔,可选
)
sub方法:
按照正则表示的内容替换字符串, 返回替换后的字符串
Pattern.sub(
repl, # 替换为
String, # 需要替换的对象字符串
Count # 替换次数,可选,默认全部替换
)