正则表达式
.
—> 代表任意非换行\n符之外的任意字符
[...]
—> 字符集 例如:[A-Za-z0-9]
{n}
—> 重复前面字符n次。
\d
—> 匹配0-9 \D 匹配非数字
\s
—> 匹配空白 \S 匹配非空白
\w
---->相当于[A-Za-z0-9_] \W 匹配非w
*
—>匹配前面字符0次或者无限次 若不确定要匹配的字符有没有,使用*
+
—>匹配前面字符1次或者无限次 若确定要匹配的字符一定有一个,使+
?
—>匹配前面字符的0次或者1次,加上会变成 非贪婪模式,就是找到第一个符合条件的就不下找,然后返回出来。
贪婪模式
是找到第一个符合前面条件的,和找到最后一个符合后面条件,之间的内容。默认的就是贪婪模式
$
—>判定最后一个字符是否为指定字符。 例如’(.com)$’,意思是判断某个字符串是否以.com结尾
^
—>判定第一个字符是否为指定字符
^
—>若在[]里,表示除了[]里的字符,之外的只读
t = re.match(正则表达式,查找对象) #从开始的位置开始查找
result.group() #返回匹配的字符
result.span() #返回匹配字符的索引(范围)
re.search(正则表达式,查找对象) #从任意位置开始找第一个符合正则表达式的
re.findall(正则表达式,查找对象) #找到所有满足符合正则表达式的
re.finditer(正则表达式,查找对象) #将所有满足符合正则表达式的内容生成一个迭代器
re.sub(旧值(正则表达式),新值,替换对象) #将某一个查找对象中所有符合条件的替换成新值
re.compile(正则表达式) #创建一个正则表达式对象
re.I 忽略大小写 # 这个是写到match、search、findall、finditer,方法参数列表中
re.S 忽略换行 #同上
re.split(正则,切割对象) # 正则的切割