1、正则表达式中如果想匹配元字符,那么就将元字符转义为普通字符。
正则表达式中反斜线的特殊用法
\d [0-9] #匹配0--9任意一个
\D [^0-9] #匹配不带有0--9的字符串
\s [\t\n\r\f\v] #匹配计算机当中的空白符
\S #匹配非空字符
\w [0-9 a-z A-Z]
\W [^0-9 a-z A-Z]
2、在正则表达式中,在需要重复匹配的字符后面加上{num},表示这个字符要重复匹配num次
3、正则表达式中,在字符后面加
* 表示要匹配0次---多次
+ 匹配一次---多次
?匹配0次--1次
如果正则表达式中有可选字符的话,可以把?放在那个字符的后面,这样匹配的时候如果出现这个字符的话会匹配,否则就会跳过不匹配。
4、{m,n}加在字符后面,至少重复匹配m次,至多重复匹配n次
{0,}等价于*
{1, }等价于+
{1,0}等价于?
5.re.comlile(正则表达式),
将括号内的正则表达式编译为一个正则对象,可以提高匹配的速度,还可以在匹配过程中引用一些方法
6、match()在首部匹配正则表达式
search()只匹配符合正则表达式的第一个字符串
(上面两个匹配之后返回的都是一个对象类型的数据)
findall() 匹配整个字符串,把匹配到的结果返回一个列表
7、re.sub(正则表达式,要替换的字符串,被替换的要匹配的字符串)
根据正则表达式在字符串中匹配的情况,用其他的字符串来替换已经匹配的那一段。
re.subn()返回的结果中显示替换了多少次
8、re.split(正则表达式,字符串)
根据正则表达式匹配到的字符分割这个字符串,返回一个列表
9、"."这是一个通配符,可以匹配除了转义字符以外的所有字符