正则表达式简单介绍
定义:
就是事先先定义好的一些特定字符及这些特定字符的组合,组成一个"规则字符串",这个"规则字符串"用来表达对字符串的一种过滤逻辑.
方法:
- re.compile(编译)
- pattern.match(从头找一个)
- pattern.search(找一个)
- pattern.findall(找所有)
- pattern.sub(替换)
下面为了大家可以更清晰的复习和了解到正则,我特意从网上找到了一张比较全面的图,用来供大家参考.
python中原始字符串r的用法
r’\nab’明明就是’\nab’,为什么匹配不到呢???
在Python正则表达式中尽可能使用原始字符串,待匹配的字符串中看到什么就在正则表达式写什么,就不会出现问题.
windows下不使用原始字符串会出现的问题:
正则使用的注意点:
-
re.findall(“a(.*)b”,“str”),能够返回括号中的内容,括号前后的内容起到定位和过滤的效果.
-
原始字符串r,待匹配字符串中有 反斜杠() 的时候,使用r能够忽视 反斜杠() 带来的转义的效果
-
点号(.)默认情况匹配不到 “\n”
-
“\s"能够匹配空白字符,不仅仅包含空格,还有”\t \r \n"