常用模块-re
*正则表达式是对字符串操作的一种逻辑公式,我们一般使用正则表达式对字符串进行匹配和过滤,只用正则的优点:
优点:灵活,功能性强,逻辑性强。
缺点:上手难,一旦上手,会爱上这个东西。
正则表达式由普通字符和元字符组成,普通串字符包含大小写字母,数字。在匹配普通字符的时候我们直接写就可以,比如“abc".
元字符:元字符才是正则表达式的灵魂。元字符中的内容太多了,在这里我们介绍一些常用的。
1.字符组
字符组很简单用【】括起来
[a-zA-Z0-9] 匹配的是什么?
2.简单元字符
基本的元字符。这个东西网上一搜一大堆。但是常用的就以下。
. 匹配除换行符意外的任意字符
\w 匹配字母数字或下划线
\s 匹配任意的空白符
\W 匹配非字母数字下划线
\n 匹配的一个换行符
\d 匹配的是数字
\t 匹配的是制表符
a|b匹配字符a 或字符b
print(r周润发/n李嘉诚/t)