Python数据分析1——正则表达式之（.*？）匹配和 \ 转义

最新推荐文章于 2024-01-02 15:18:03 发布

hitshc

最新推荐文章于 2024-01-02 15:18:03 发布

阅读量717

点赞数

分类专栏：爬虫常用正则表达式文章标签： python 正则表达式字符串

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HITerrrrrr/article/details/105445056

版权

本文介绍了Python数据分析中常用的正则表达式（.*?）和转义符的应用。（.*?）用于模糊匹配目标字段，确保目标字段在匹配内容中，而用于转义特殊字符，消除其在正则表达式中的特殊含义。同时提到了和在处理网页源代码时的重要性。

摘要由CSDN通过智能技术生成

正则表达式条目众多、纷繁复杂，我在接触正则的时候就感觉有些摸不着头脑，甚至到现在为止也理得不是很清。每次想要去记一下表达式具体含义时，都会因为太多而不了了之，就想如果用到现查也是不错的选择。

但是有两个正则是我每个爬虫任务都必用的，这两个万金油的正则表达就是**（.*？）和 \ **。在之前所做过的爬虫中我都用这个正则把想要的字给匹配出来，以至于我只会这一个爬虫的匹配字段方式，而没有去接触和了解其他的匹配技术，这是有些遗憾的。

**（.*？）用法简而概之就是：**

1.明确原始字符串（其中包含目标字段）和目标字段
2.在原始字符串中找到包含目标字段的句话或者一行或者一段，用（.*？）来替换目标字段。也可以理解为 .*? 替换目标字段，然后用括号把目标字段括起来。
3.匹配的代码是：

re.findall('包含目标字段的一句话或者一行或者一段'，原始字符串名，re.S)

###包含目标字段的一句话或者一行或者一段就是从原始字符串里摘出来的一部分，必须要保证目标字段包含在内，并且前后都要有内容。这里有几个注意事

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。