正则表达式基础
常用九种正则符号
一、原字符
二、英文状态的 .
代任意字符(数字、字母、标点符号、汉字等),不包括换行 \n
三、反斜杠 \
表示转义符
① \n 表示换行
② \t 表示tab制表符
③ \d 表示0-9的任一数字
④ \s 表示任意一种空白
⑤ \w 表示字母、数字、下划线任意一种
⑥ \. 表示句号点本身
⑦ \\ 表示斜杠本身
四、英文状态的中括号[]
表示字符集合,当需要特定字符匹配,可以选择中括号
13453245623
1[356789]{9}
1.6L,1.6T
1.6[a-zA-Z]
五、英文状态的圆括号()
截取出特定内容
age:9
age:(\d)
六、英文状态的问号
表示匹配前一个字符0次或1次
七、英文状态的加号
表示匹配前一个字符1次及以上
八、英文状态的星号 *
表示匹配前一个字符0次及以上
九、英文状态的大括号 {}
表示匹配前一个字符指定的次数或范围
{m} 匹配前一个字符m次
{m,} 匹配前一个字符至少m次
{m,n} 匹配前一字符m次或n次
使用正则表达式的三种场景
import re
一、findall (匹配)
re.findall(pattern=pattern, string=string)
二、sub (替换)
re.sub(pattern=pattern,repl=replace,string=string)
三、split (切割)
re.split(pattern=pattern,string=string)