普通字符作为原子
import re 正则表达式要运用一个re模块
re.search(pat,string) 第一个参数是正则表达式内容,第二个是字符串内容
运行结果为
非打印字符作为原子
#\n 换行符 \t 制表符 这些为非打印字符
能匹配出来
通用字符作为原子
\w 匹配任意一个字母数字或下划线
\W匹配除字母数字或下划线的任意字符
\d十进制数字
^非
元字符
.除换行外任意一个字符
^匹配开始位置
$匹配结束位置
0\1\多次 (前面出现)
?0\1次
+1\多
{n}恰好n次
{n,}至少出现n次
{n,m}至少n,至多m
!模式选择符或
()模式单元
(.?)
模式修正符
I 匹配时忽略大小写*
M 多行匹配*
L 本地化识别匹配
U unicode
S 让,匹配包括换行符*
忽略大小写所以能匹配出来
贪婪模式与懒惰模式
贪婪模式:尽可能多的去匹配
懒惰模式:尽可能少的去匹配
.✳贪婪匹配,匹配全部
.*?懒惰模式 找到第一个匹配就结束(精准)
正则表达式函数!!!
rst=re.search(pat,string,re.l)
1.match
从头开始匹配
2.search
可以从任意一个地方匹配
3.全局匹配函数
pat:正则表达式 findall:数据
rst=re.compile(pat).findall(string)