常见的正则字符和含义如下:
. 匹配任意字符,除了换行符
-
匹配前一个字符 0 次或多次
- 匹配前一个字符 1 次或多次
? 匹配前一个字符 0 次或 1 次
^ 匹配字符串开头
$ 匹配字符串末尾
() 匹配括号内表示式,也表示一个组
\s 匹配空白字符
\S 匹配任何非空白字符
\d 匹配数字,等价于[0-9]
\D 匹配任何非数字,等价于[^0-9]
\w 匹配字母数字,等价于[A-Za-z0-9]
\W 匹配非字母数字,等价于[^A-Za-z0-9]
[] 用来表示一组字符
Python 正则表达式有以下 3 种方法:
re.match 方法:从字符串起始位置匹配一个模式,如果从起始位置匹配了,match()就返回none。
语法 re.match(pattern, string, flags=0)
pattern:正则表达式
string:要匹配的字符串
flags:控制正则表达式的匹配方式,如 是否区分大小写、多行匹配等
re.search方法:只能从字符串的起始位置进行匹配。
find_all方法:可以找到所有的匹配。