正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
1.字符类:
python 中特殊字符 \ . ^ $ ? + * { } [ ] ( ) |
- ^ 匹配首个字符
- $ 匹配字符串末尾
- . 匹配任意字符,当re.DOTALL标记被指定时,可以匹配换行字符
- […]用来表示一组字符
[^…]不在[]的字符
re.‘.{n}’ n表示字符连续数量的匹配
a|b 匹配字符a 或者b
\w 匹配字母数字以及_
- \W 匹配非字母数字
- \s 匹配任意空白字符
- \S 匹配非任意空白字符
- \d 匹配任意数字 \D匹配任意非数字