Python 正则表达式：用法简单记录

最新推荐文章于 2024-05-28 00:40:05 发布

码农的快乐生活

最新推荐文章于 2024-05-28 00:40:05 发布

阅读量153

点赞数

文章标签： python 正则表达式字符串

本文链接：https://blog.csdn.net/qq_20184333/article/details/111350100

版权

1. "."号的用法

import re
rs1 = re.findall("a.c", "abc")
rs2 = re.findall("a.c", "a\nc")
print("rs1 = ", rs1)
print("rs2 = ", rs2)

rs1 =  ['abc']
rs2 =  []

原因是“.”可以匹配除“\n”以外的任意字符，但是在DOTALL模式下和S模式下是可以匹配任意字符的，用法如下:

rs2 = re.findall("a.c", "a\nc",flags=re.DOTALL) # 或者flags=re.S

2."\"的用法

rs = re.findall("a\.c", "a.c")

意思就是如果不加这个“\”符，“.”就会识别任意字符，但是加了之后，这个“.”就是代表一个字符“.”，而不能代表别的东西了，就不含有这个字符在正则里面的特殊用法了。当然转义字符用在其他的符号上依此类推。

3."[]"的用法

rs = re.findall("a[bcd]e", "abe")

结果会返回rs = [“abe”]，因为“[]”是表示其中的字符一个符合，就可以匹配目标字符。在这里就是a，e之间存在bcd中的一个，即可匹配这个字符串。但是如果是"abce"，便不可以匹配，会返回空。

4."|"的用法

这个用法非常简单，就是或的意思，只要符合这些“|”分开的这些表达式中的一个，就可以满足这块内容的匹配。可以放在外面，或者“[]”里面，或者“()”里面。

5.一些字符集的用法，常见的有"\d \D \s \S \w \W".

\d 数字：[0-9]
\D 非数字：[^\d] 注：在正则的“[]”里面，“^”开头一般是非的意思，就是除了后面这个字符
\s 空白字符：[<空格>\t\n\r\f\v]
\S 非空白字符：[^\s]
\w 单词字符：[a-zA-Z0-9_] 注：其实中文字符乃至很多国家的字符也行
\W 非单词字符：[^\w]

rs = re.findall("a\d", "a1")  # 该式子就可以匹配a加一个数字字符，其他同理

6.数量词的用法"* + ? ｛m｝"

* 匹配前一个字符0次或者无数次
+ 匹配前一个字符1次或者无数次
？匹配前一个字符0次或1次
{m} 匹配前一个字符m次

rs = re.findall("a+", "aaa")  # 该式子就可以匹配一个以上的a字符，同理如果换成*和？就可以实现上述
							  # 的效果

今天就写到这里吧，虽然之前学爬虫之前就已经学过一段时间的正则表达式，但是忘记记录了，现在是补录，时间为 2020/12/18 ，其实也就是简单的复习了一下re模块的基础用法。还有诸如match，search，sub，以及贪婪非贪婪的用法，还有r语句的用法，balabala。今天已是凌晨0.14，下班。上述特性更不更看心情 0.0

码农的快乐生活

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python 正则表达式：用法简单记录

1. "."号的用法import rers1 = re.findall("a.c", "abc")rs2 = re.findall("a.c", "a\nc")print("rs1 = ", rs1)print("rs2 = ", rs2)rs1 = ['abc']rs2 = []    原因是“.”可以匹配除“\n”以外的任意字符，但是在DOTALL模式下和S模式下是可以匹配任意字符的，用法如下:rs2 = re.findall("a.c"
复制链接

扫一扫