作用:
让输入遵循某种规范
找出有用的数据
import re
re.match(正则表达式, 处理的字符串)
如果匹配有返回值,反之则无
re.group() 合适的存入的数据
匹配单个字符
[] 匹配列举的字符
. 匹配任意字符 除\n
\d 匹配数字
\D 匹配非数字
\s 匹配空白
\S 匹配非空白
\w 匹配单词字符
\W 匹配非单词字符
多个字符:
{m}是指前面的数据出现m次 只判断开头
{n,m}是指前面数据出现n到m次
?是前面数据可有可无 有也只能有一个 至多一个
*匹配前一个字符出现0次到无限次,可有可无
+ 至少一次
.* 匹配除了\n的所有任意字符串
想要匹配\n match参数中加入re.S
^匹配开头
¥匹配结尾
正则表达式中用到了特殊字符需要转义
分组:
(数据段1 | 数据段2)
用group 参数为获取到的第几个括号的数据
正则表达式中取括号内容用\序号
(?P正则表达式) 括号内容起别名
(?P=name) 引用name分组匹配字符串
高级应用Python独有:
search 不必从头匹配 只从字符串中匹配任意 只找第一个
findall 找出所有符合
sub 找到后替换 支持回调函数
split 切割字符串