常用的正则简述要点
“”"
正则表达式 re 模块
import re
re.match()
re.search()
re.findall()
re.sub(pattern, ‘新的内容’, str) 替换
re.split(pattern, str) —> []
总结:
. 任意字符处(\n)
^ 开头
$ 结尾
[] 范围
| 表示或者
小括号( | | )表示的是多个或者
正则预定义
\s 空白(空格)
\b 边界
\d 数字
\w word [0-9a-zA-Z]
r 防止字符串中 转义字符
大写反面
‘\w [0-9]’ --> \w 智能匹配一个字母
量词
* >=0 用于验证将前面的模式匹配0次或多次 >=1
+ >=1 用于验证将前面的模式匹配1次或多次 >=0
? 0,1 用于验证将前面的模式匹配0次或1次 0, 1
分组:
() ---> group(1)
手机号码正则
re.match('1[35789]\d{9}$', phone)
{m},用于验证将前面的模式匹配m次 ^ 开头 $ 结尾
{m,},用于验证将前面的模式匹配m次或者多次 >=m
{m,n},用于验证将前面的模式匹配大于等于m次 并且小于等于n次
“”"
开始使用
首先导入
import re
简单的例子
比较重要的例子
1 匹配数字
2 验证输入的邮箱
3 不是以4, 7结尾的手机号码(11位)
4 爬虫