python正则表达式（.?）与（.）的区别

最新推荐文章于 2024-05-25 12:28:46 发布

爱生活爱自己爱学习

最新推荐文章于 2024-05-25 12:28:46 发布

阅读量5.8k

点赞数 7

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37962192/article/details/103768541

版权

python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

在scrapy时，我希望能够从url里提取出一些信息，但是按照网上的例子总是不成功，可把我给急坏了，时间过得太快了，我的急躁而不知如何的毛病似乎还没有改。

首先在正则表达式中，通过（）是可以代表要提取的内容的，如（参考https://blog.csdn.net/weixin_43487902/article/details/88407311）

我通过测试发现：

（.*?）与（.*）是不同的，正如资料所示，（.*）是贪婪的，比如对于a123ba123b,正则表达式re.findall('（.*）', 'a123ba123b')得到的结果是

而（.*?），惊讶的发现得到的是两个空

这是因为（.*?）是非贪婪的，即匹配最少数量的就够了，所以匹配了a之后的两个空字符串，如果你将表达式改为

a(.*?)b，下面的结果就说明了是非贪婪造成了上面得到的结果为空，这也是我在做字符串提取时，提取到的结果一直是空字符串的原因。

最终通过下面这种方法提取到了url中的信息（通过

re.findall('weibo.com/(.*?)', 'https://weibo.com/a454656b43534543a1232435b546546') 得到的将会是空

）

爱生活爱自己爱学习

关注

7
点赞
踩
15

收藏

觉得还不错? 一键收藏
2
评论
python正则表达式（.*?）与（.*）的区别

在scrapy时，我希望能够从url里提取出一些信息，但是按照网上的例子总是不成功，可把我给急坏了，时间过得太快了，我的急躁而不知如何的毛病似乎还没有改。首先在正则表达式中，通过（）是可以代表要提取的内容的，如（参考https://blog.csdn.net/weixin_43487902/article/details/88407311）我通过测试发现：（.*?）与（.*）...
复制链接

扫一扫

专栏目录

爱生活爱自己爱学习 CSDN认证博客专家 CSDN认证企业博客

码龄7年

64: 原创

8万+: 周排名

96万+: 总排名

14万+: 访问

: 等级

1749: 积分

15: 粉丝

55: 获赞

40: 评论

182: 收藏

私信

关注

热门文章

分类专栏

最新评论

pytorch加载模型torch.load() 遇到问题ModuleNotFoundError: No module named 'models'
牛猫一号: 像楼上这个老哥说的方法，直接引入一个yolov5工程的路径也可以解决这个问题
pytorch加载模型torch.load() 遇到问题ModuleNotFoundError: No module named 'models'
牛猫一号: 写load的这个文件要放到具有yolov5工程的文件夹里运行，因为它会寻找原生yolo5工程下的models文件夹，里面还会有yolo.py等文件存在，这就是这个找不到"models"的由来，感觉这代码傻傻的
知识图谱表示学习Transe TransD TransR等的评价指标 hit@10、mean rank的理解
LS391: 博主您好，请问transE算法，好像无法预测没有训练过的实体，那么测试集需要从训练集里拿吗
问题待解 python with open 再进行for循环遍历
starwenran: python的读写流按行读取到一个列表中，使用游标进行迭代，读取一次，游标加1 ，第一个for循环，游标会走到3的位置，输出之前：%，判断是否==% ，是，跳出当前循环，现在的游标从3变成4，到第二个循环，输出之后：4 没有循环终止，继续输出之后：5 , 游标的值等于lines的长度，结束循环，最后一个循环，lines中已经没有数据了，不会输出，至于会不会执行，这个你可以验证下,在第一个循环前面，加上print(next(lines))，看下输出效果，以及在第三个循环前加上print(next(lines))
问题待解 python with open 再进行for循环遍历
starwenran: 编程语言中都绕不开指针，python只是弱化了指针概念，变量名要与内存地址挂钩

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。