一、导入模块re模块 import re
二、re.match(正则表达式,需要正则去匹配的字符串) :根据正则表达式去匹配字符串,此方法从头开始匹配,开头匹配不对直接返回none值。
三、re.search(正则表达式,需要正则去匹配的字符串) :根据正则表达式去匹配字符串,此方法会查询字符串所有内容,查询不到才返回none值,但只要查询到一个匹配的就不会继续往下查询。
ps:二、三返回是<re.Match object; span=(0, 6), match='查找到的内容'>这个内容,span为查找到的位置
四、span()返回查找到的位置
五、group(数字)返回查找到的内容,加上数字可以把里面分组的分别查出来,例如
group(1)代表返回第一组
六、re.findall(正则表达式,需要正则去匹配的字符串):根据正则表达式去匹配字符串,可以查找多个匹配到的,返回值是一个列表 ['查找到的内容', '查找到的内容', '查找到的内容']
七、re.sub(正则表达式,新内容,需要正则去匹配的字符串):根据正则表达式匹配到需要替换的内容,然后用新内容去替换
八、split(正则表达式,需要正则去匹配的字符串):当正则表达式匹配到内容,就以该内容进行分割,将分割后的内容放到列表里面。
九、基础
1、. 代表任意字符
2、[] 代表范围
3、| 或者
4、()一组 ?P<名字> 用于起名
十、量词
1、* 代表>=0
2、+ 代表>=1
3、?代表0,1
4、{m} 代表M位
5、{m,}代表>=m位
6、{m,n}代表>=m位 <=n位
十一、预定义
\s 空格
\S 非空格
\d 数字
\D 非数字
\w 包含[a-z0-9A-Z]
\W 不包含[a-z0-9A-Z]
.....更多自行再百度