正则表达式
1. 实例引入
a-z
代表匹配任意的小写字母
\s
表示匹配任意的空白字符
*
就代表匹配前面的字符任意多个
\w
匹配字母、数字及下划线
\W
匹配不是字母、数字及下划线的字符
.
可以匹配任意字符(除换行符)
.*
可以匹配任意字符(贪婪)
+
匹配 1 个或多个表达式
.*?
非贪婪
2. match()
向它传入要匹配的字符串以及正则表达式,就可以检测这个正则表达式是否匹配字符串
match() 方法会尝试从字符串的起始位置匹配正则表达式,如果匹配,就返回匹配成功的结果;如果不匹配,就返回 None。
在 match() 方法中,第一个参数传入了正则表达式,第二个参数传入了要匹配的字符串。
打印输出结果,可以看到结果是 SRE_Match 对象,这证明匹配成功。该对象有两个方法:group() 方法可以输出匹配到的内容;span() 方法可以输出匹配的范围。
3.sub()
除了 使用正则表达式提取信息外,有时候还需要借助它来修改文本。比如,想要把一串文本中的所有数字都去掉,如果只使用字符串的 replace() 方法,那就太烦琐了, 这时可以借助 sub() 方法。