表达式 | 含义 |
---|---|
‘.’ | 默认匹配除\n之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行 |
‘^’ | 从字符开头开始匹配 |
‘$’ | 匹配字符结尾 |
‘*’ | 匹配号前的字符0次或多次,re.findall("ab",“cabb3abcbbac”) 结果为[‘abb’, ‘ab’, ‘a’] |
‘+’ | 匹配前一个字符1次或多次,re.findall(“ab+”,“ab+abb+abbb+bba”) ,b可匹配多次,结果[‘ab’, ‘abb’,‘abbb’] |
‘?’ | 匹配前一个字符1次或0次 |
‘{m}’ | 匹配前一个字符m次 |
‘{n,m}’ | 匹配前一个字符n到m次 |
‘|’ | 匹配|左或|右的字符,re.search(“abc|ABC”,“ABCBabcCD”).group() 结果’ABC’ |
‘(…)’ | 分组匹配 ,,re.search("(abc){2}a(123|456)c", “abcabca456c”).group() 结果 abcabca456c |
‘\A’ | 只从字符开头匹配 |
‘\Z’ | 匹配字符结尾,同$ |
‘\d’ | 匹配数字0-9 |
‘\D’ | 匹配非数字 |
‘\w’ | 匹配[A-Za-z0-9] |
‘\W’ | 匹配非[A-Za-z0-9] |
‘s’ | 匹配空白字符、\t、\n、\r , re.search("\s+",“ab\tc1\n3”).group() 结果 ‘\t’ |
基本用法
import re
"""match从头开始搜索"""
print(re.match("Chen", "ChenSanchuan123").group()) # 匹配字符开头,group()显示结果
print(re.match("Chen\d+", "Chen321Sanchuan123").group()) # 匹配Chen及数字
print(re.match("C.+21", "Chen321Sanchuan123").group()) # 匹配C开头21结尾的字符
"""search全部搜索"""
print(re.search("R[a-zA-Z]+a", "Chen321Sanchuan123Sanchuan").group()) # 匹配R开头任意字母,a结尾,只打印第一个
print(re.search("#.+#", "1123#hello#").group().replace('#', '')) # 匹配俩#之间的内容
print(re.search("aaA?", "aassssfaaa").group()) # ?匹配一次或0次 可以没有
print(re.search("[0-9]{3}", "a1a2aa4567aaaa").group()) # 匹配0-9之间的数字3次
print(re.search("(abc){2}\|{2}", "asdasabcabc||cabvc32").group()) # 匹配abc两次 | 两次
"""findall匹配所有"""
print(re.findall("[0-9]{1,3}", "a1a2aa4567aaaa")) # 匹配1-9之间的数字1到3次
"""分组匹配"""
print(re.search("(?P<province>[0-9]{6})(?P<birthday>[0-9]{8})", "130684197001012494").groupdict("city"))
"""分割"""
print(re.split('[0-9]{1,}', 'Beijing32ShangHai3344HeBei')) # 按1到多个数字分割
"""替换"""
print(re.sub('[0-9]+', ' | ', 'ad1sd234sadg376sad', count=2)) # 把前两组数字替换成 |