1.元字符总结
匹配单个字符:. […] [^…] \d \D \w \W \s \S
匹配重复: * + ? {n} {m,n}
匹配位置: ^ $ \A \Z \b \B
其他: | () \
2. python re模块
regex = compile(pattern,flags = 0)
功能:生成正则表达式对象
参数:pattern 正则表达式
flags 功能标识位,扩展正则表达式功能
返回值: 正则表达式对象
re.findall(pattern,string,flags = 0)
功能: 使用正则匹配目标字符串
参数:pattern 正则
string 目标字符串
返回值: 匹配内容列表,如果正则表达式有子组则只得到子组对应内容
如果有多个分组,那就把每一个分组看成一个单位,组合为一个元组,然后返回一个含有多个元组的列表。
findall若想获得所有匹配内容而非子组内容时可将子组变为非捕获组(?:xxx)
pattern = r'(?:\w+):(?:\d+)'
转载:https://blog.csdn.net/qq_42739440/article/details/81117919
re.split(pattern,string,flags=0)
功能: 使用正则表达式匹配内容切割字符串
参数:pattern正则
string 目标字符串
返回值: 切割后的内容列表
re.sub(pattern,replace,string,max,flags)
功能: 使用指定字符串替换正则匹配到的内容
参数:pattern 正则
replace 指定字符串
string 目标字符串
max 最多匹配几处
返回值: 替换后的字符串
subn() 用法参数同sub 返回值为元素:替换后的字符串和替换个数
re.finditer(pattern,string,flags)
功能: 使用正则表达式匹配目标内容
参数:pattern 正则
string 目标字符串
返回值: 匹配结果的迭代对象
re.fullmatch(pattern,string,flags)
功能:使用正则表达式完全匹配目标字符串
参数:pattern 正则
string 目标字符串
返回值: 匹配结果的match对象
re.match(pattern,string,flags)
功能:使用正则表达式匹配目标字符串开头
参数:pattern 正则
string 目标字符串
返回值: 匹配结果的match对象
re.search(pattern,string,flags)
功能:使用正则表达式匹配目标字符串第一处匹配内容
参数:pattern 正则
string 目标字符串
返回值: 匹配结果的match对象
regex对象属性变量
flags : 标识位值
pattern : 正则表达式
groups : 子组数量
groupindex : 捕获组名和组序号组成的字典
match对象的属性和方法
1. 属性变量
pos 目标字符串开始位置
endpos 目标字符串结束位置
re 正则表达式
string 目标字符串
lastgroup 最后一组组名
lastindex 最后一组序号
2. 属性方法
span() 获取匹配内容的起止位置
start() 获取匹配内容的开始位置
end() 获取匹配内容的终止位置
groups() 获取每个子组对应的内容
groupdict() 获取捕获组字典 组名为键,对应内容为值
group(n = 0)
功能:获取match对象对应的内容
参数: 数字表示获取相应的子组匹配内容,默认表示全部匹 配内容
子组名称表示获取对应捕获组匹配内容
返回值:匹配的字符串