爬虫学习——（二）正则表达式

VIP文章 59％

已于 2022-07-24 16:20:55 修改

阅读量387

点赞数 2

文章标签：学习

于 2022-07-24 16:18:45 首次发布

本文链接：https://blog.csdn.net/weixin_52024937/article/details/125960094

版权

一、常用匹配规则介绍

正则表达式常用匹配规则（参考学习网址）：正则表达式 – 语法 | 菜鸟教程

二、常用匹配方法

1.match

match方法中，第一个参数传入正则表达式，第二个参数是传入要匹配的字符串。

match方法会尝试从字符串的‘起始位置’开始匹配正则表达式，如果匹配，就返回匹配成功的结果；如果不匹配则返回None。实例如下：

import re
content = 'Hello 123 4567 World_This is a Regex Demo'
print(len(content)) #查看字符串的长度
result = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}',content)
#result = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}.*Demo$',content)  #匹配所有字符
print(result)
print(result.group())  #返回匹配结果
print(result.span())   #输出范围

运行结果：

41
<re.Match object; span=(0, 25), match='Hello 123 4567 World_This'>
Hello 123 4567 World_This
(0, 25)

匹配目标

要想在一段文字中提取一部分内容，可以使用括号()将想要提取的子字符串括起来。()实际上标记了一个子表达式的开头和结束的位置，被标记的每个子表达式依次对应每个分组，调用group方法传入分组的索引就可以获取提取结果，实例如下：

import re
content = 'Hello 1234567 World_This is a Regex Demo'
result =

最低0.47元/天解锁文章

59％

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
爬虫学习——（二）正则表达式

如何通过正则表达式进行python网络爬虫？熟练掌握这些方法即可。
复制链接

扫一扫

爬虫学习——（二）正则表达式

一、常用匹配规则介绍

二、常用匹配方法

1.match

“相关推荐”对你有帮助么？