re模块
使用正则表达式需要用到re模块
1.提取
import re
语法:
ret = re.findall(正则表达式,被提取的字符串)
返回的类型是列表
2.匹配
语法:
ret=re.match(正则表达式,被匹配的字符串)
注:
如果匹配成功,返回<class 're.match‘对象’>
如果匹配不成功,返回None
3.替换
语法:
ret=re.sub(正则表达式,替换成的字符串,被匹配的字符串)
在提取html提取正则表达式时,因为html中存在换行符\n,因此现将换行符替换为空
html = re.sub('\n','',html)
去掉首尾的空格:
ret[0].strip()
4.防转译
在定义正则表达式时,为防止转译在前面加r
password_pattern = r'^[a-zA-Z][a-zA-Z0-9_]{5,15}$'