正则表达式

最新推荐文章于 2024-05-20 10:35:51 发布

白炎灵

最新推荐文章于 2024-05-20 10:35:51 发布

阅读量127

点赞数

分类专栏： python学习

本文链接：https://blog.csdn.net/weixin_43135165/article/details/102763650

版权

68 篇文章 3 订阅

订阅专栏

在爬虫的时候，正则表达式是一个非常好的助手，这篇博文主要记录下正则表达式中的基本符号。

下面是re模块的几个核心函数。
1.re.compile(pattern, flags=0)
返回正则表达式对象

2.re.match(pattern, string, flags=0)
如果成功匹配字符串的话，返回对象，否则，返回None

3.re.findall(pattern, string, flags=0)
查找字符串所有与正则表达式匹配的模式，返回字符串的列表

4.re.sub(pattern, repl, string, count=0, flags=0)
用指定的字符串去替换原子符串中与正则表达式相匹配的模式。

sentence = "我你dirty talk，你dirty talk，我"
m = re.sub("[dirty talk]+","*",sentence)
m

Out：

'我你*，你*，我'

5.re.split(pattern, string, maxsplit=0, flags=0)
用与正则表达式相匹配的模式去分割字符串，返回列表。

sentence = "Help# on   & function, split in module re"
m = re.split("[#&,(?!(\s))]+",sentence)
m

Out:

['Help', 'on', 'function', 'split', 'in', 'module', 're']

关注

专栏目录