1.匹配方式
- \d 匹配一个数字。
- \w 匹配一个字母或者一个数字。
- \s 匹配一个空格。
- * 表示任意个字符,包括 0 个。
- + 表示至少有一个字符。
- ? 表示0 或 1 个字符。
- {n} 表示n 个字符。
- {n,m} 表示 n - m 个字符。
- [ ] 表示范围。[0-9a-zA-Z]可以匹配一个数字或字母。
- 特殊字符用 \ 转义。【强烈建议使用Python的
r
前缀,就不用考虑转义的问题了】 - ^ 表示开头, ^\d 表示以数字开头。
- $ 表示结尾。
- . 表示除\n外的任意字符
2.判断匹配
用match()来判断
3.简单应用
1.规范化字符串
2.分组
()表示分组,用正则表达式定义分组。注意到group(0)
永远是原始字符串,group(1)
、group(2)
……表示第1、2、……个子串
4.注意
正则表达式默认的是贪婪匹配。(匹配尽可能多的字符)
由于\d+
采用贪婪匹配,直接把后面的0
全部匹配了,结果0*
只能匹配空字符串了
加个?
就可以让\d+
采用非贪婪匹配