re模块正则表达式
正则表达式就是记录文本规则的代码,在实际开发的过程中,通常会有查找某些符合规则的字符
正则规则:
匹配单个字符
代码 | 功能 |
---|---|
\d | 匹配数字,0-9 |
\D | 匹配非数字 |
\s | 匹配空白,空格,tab键 |
\S | 匹配非空白 |
\w | 匹配非特殊字符,a-z,A-Z,0-9,_,汉字 |
\W | 匹配特殊字符,非字符,非数字,非汉字 |
. | 匹配任意1个字符除\n |
[] | 匹配[]中列举的字符 |
匹配多个字符
匹配多个字符不能单独使用,要与单字符配合使用
代码 | 功能 |
---|---|
* | 前一个字符出现0或无限次 |
+ | 前一个字符出现1次或无限次,即至少有1次 |
? | 前一个字符出现1或0,要么有1次要么无 |
{n} | 前一个字符出现n次 |
{m,n} | 前一个字符出现m到n次 |
匹配以…开头/结尾
代码 功能 | |
---|---|
^ | 匹配字符串开头 |
$ | 匹配字符串结尾 |
其他规则
代码 功能
丨 或者,匹配左右任意一个表达式
[^指定字符] 非,即除了指定字符以外都匹配
( ) 括号内的作为一个分组
\num 引用分组num匹配到的字符串
(?P/< name>) 分组起别名