Python 中正则表达式(.*?) 的理解

最新推荐文章于 2024-09-03 22:33:37 发布

yinwaner

最新推荐文章于 2024-09-03 22:33:37 发布

阅读量1.8w

点赞数 18

分类专栏： Python

本文链接：https://blog.csdn.net/yinwaner/article/details/88839623

版权

Python 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

在Python开发爬虫过程中经常会遇到正则表达式，其中(.*?) 的使用概率较高，那么这个正则表达式到底什么意思呢？

“.*?” 表示非贪心算法，表示要精确的配对。

“.*”表示贪心算法，表示要尽可能多的匹配

“()” 表示要获取括弧之间的信息。

用一个例子来说明一下。

import re

a = 'xxIxxjshdxxlovexxsffaxxpythonxx'

infos = re.findall('xx(.*?)xx', a)

print(infos)

此时字符串的解析结果应该为：

xxIxx

jshd

xxlovexx

sffa

xxpythonxx

符合检索条件的为：

xxIxx

xxlovexx

xxpythonxx

由于只需要获取() 之间的数据，所以最终的结果为：

['I', 'love', 'python']

如果使用“.*”表达式，则反馈去掉头尾xx 之间的全部数据。

['Ixxjshdxxlovexxsffaxxpython']

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

yinwaner

关注关注

18
点赞
踩
66

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python中正则表达式的使用详解(相当全面)

景天科技苑

01-02

1万+

正则表达式是什么?它是约束字符串匹配某种形式的规则#正则表达式有什么用?1.检测某个字符串是否符合规则.比如:判断手机号,身份证号是否合法2.提取网页字符串中想要的数据.比如:爬虫中,提取网站天气,信息,股票代码,星座运势等具体关键字正则只能匹配字符串格式，不能判断逻辑，判断逻辑要通过代码去实现

python正则表达式(.*?)以及compile的用法示例

软件测试

05-03

1136

在Python开发爬虫过程中经常会遇到正则表达式，其中(.*?) 的使用概率较高，那么这个正则表达式到底什么意思呢？ “.*?” 表示非贪心算法，表示要精确的配对 “.*”表示贪心算法，表示要尽可能多的匹配 “()” 表示要获取括弧之间的信息 Python提供re模块，包含所有正则表达式的功能。由于Python的字符串本身也用\转义，所以要特别注意： s = 'ABC\\-001...

参与评论您还未登录，请先登录后发表或查看评论

python中“（.*）” 、 “（.*？）”的区别

weixin_39833509的博客

07-08

3212

python 正则表达式“.*”和“.*? ”的区别

最新发布

qq_40107571的博客

09-03

589

python 正则表达式“.*”和“.*? ”的区别

python正则表达式(.*?)的理解

Lavi的专栏

08-01

7025

“.*?” 表示非贪心算法，表示要精确的配对。 “.*”表示贪心算法，表示要尽可能多的匹配 “()” 表示要获取括弧之间的信息。

正则表达式（python）

leidawangzi的博客

02-26

1302

一、正则表达式基本介绍 1.起源 正则表达式的“祖先”可以一直上溯至对人类神经系统如何工作的早期研究。Warren McCulloch 和 Walter Pitts 这两位神经生理学家研究出一种数学方式来描述这些神经网络。 1956 年, 一位叫 Stephen Kleene 的美国数学家在 McCulloch 和 Pitts 早期工作的基础上，发表了一篇标题为“神经网事件的表示法”的论文，引入了正则表达式的概念。正则表达式就是用来描述他称为“正则集的代数”的表达式，因此采用“正则表达式”这个术语。随后，

python正则 .* 和 .*? 有什么区别？re.search()用法

weixin_44285715的博客

10-27

4286

.* 和 .*? 有什么区别？ * 通配符匹配零个或多个字符 ? 通配符匹配文件名中的 0 个或 1 个字符表达式 .* 就是单个字符匹配任意次，即贪婪匹配。表达式 .*? 是满足条件的情况只匹配一次，即最小匹配。比如说匹配输入串B: 101000000000100 使用 1.*1 将会匹配到1010000000001, 匹配方法: 先匹配至输入串B的最后, 然后向前匹配, 直到可以匹配到1, 称之为贪婪匹配。使用 1.?1 将会匹配到101, 匹配方法: 匹配下一个1之前...

python中正则表达式 .*？的使用

weixin_45469590的博客

08-08

584

python中re正则表达式.*？

python中正则表达式 re.findall 用法

01-20

Python 正则表达式 正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。...本文主要给大家介绍python中正则表达式 re.findall 用法，具体内容如下所示；在python中，

python中正则表达式的使用方法

10-18

Python中的正则表达式是一个强大的文本处理工具，用于匹配、查找、替换等操作。在Python中，正则表达式的操作主要通过内置的`re`模块来实现。以下是一些关键的正则表达式概念和在Python中的使用方法： 1. **匹配...

python中正则表达式用法

Nikki0126的博客

08-15

327

https://www.runoob.com/python/python-reg-expressions.html 开头放个正则表达式解释：解析: 首先，这是一个字符串，前面的一个 r 表示字符串为非转义的原始字符串，让编译器忽略反斜杠，也就是忽略转义字符。但是这个字符串里没有反斜杠，所以这个 r 可有可无。实例： #!/usr/bin/python import re line = "Cat...

Python re.findall中正则表达式(.*?)和参数re.S使用

热门推荐

黄笳倞的博客

04-10

6万+

目录一、re.findall函数介绍二、代码如下三、re.findall中正则表达式(.*?) 四、re.findall中参数re.S的意义一、re.findall函数介绍它在re.py中有定义： def findall(pattern, string, flags=0): """Return a list of all non-overlapping match...

python中的.*?号和用途

qq_44929535的博客

11-27

4890

python中的.*?号和用途其中： .代表匹配除换行符\n以外的任意字符 *代表匹配0次或者多次？惰性匹配，非贪婪性匹配，尽可能少的匹配用途： <span class='innit_num' >人数是：20<span> import re #其中的.*?号表示匹配<span到innit_num之间的任意多字符，其他雷同 read_num = int(re.compile('<span.*?innit_num.*?(\d+).*?</span>').

python中“（.*）” 、 “（.*？）”的区别

stanary的博客

08-07

9404

【Python】正则匹配之 .*?；爬虫 (.*?)实战讲解

扶摇直上

05-13

876

正则的知识体系其实是非常庞大的，它可以做规则校验、字符匹配等，且非常强大，速度也非常快，我这里针对字符串匹配作出讲解。通常不同的工作者对正则的使用手法层出不穷，所以我这里推荐一种比较好的方法——(.*?这里给出我自己的一些经验和使用方法，以上用爬虫举例希望同学们能进一步加深对.*?以及它在数据处理应用中的理解。希望对大家的学习有所帮助，欢迎大家批评指正，我们一起学习！

(.*?)正则表达式

axe的博客

10-16

1万+

1、. 匹配任意除换行符“\n”外的字符； 2、*表示匹配前一个字符0次或无限次； 3、?表示前边字符的0次或1次重复 4、+或*后跟？表示非贪婪匹配，即尽可能少的匹配，如*？重复任意次，但尽可能少重复； 5、 .*? 表示匹配任意数量的重复，但是在能使整个匹配成功的前提下使用最少的重复。如：a.*?b匹配最短的，以a开始，以b结束的字符串。如果把它应用于aabab的话，它会匹配aab和ab。 ...

Python 正则表达式 *, + 和 ? 符号

u011699626的博客

05-07

423

符号类似于贪婪模式，会尽可能匹配到所有能够匹配到的字符。到任意次重复，尽量多的匹配字符串。上述的结果显而易见，当字符串为单个字符。结果显而易见，这里不做过多解释了。对它前面的正则式匹配。对它前面的正则式匹配。对它前面的正则式匹配。

python中.*和.*?的区别

weixin_44231554的博客

02-19

544

python中.*和.*?的区别

python 中正则表达式

02-29

Python中的正则表达式是一种强大的工具，用于在字符串中进行模式匹配和搜索。Python提供了re模块来支持正则表达式操作。以下是Python中正则表达式的一些常用功能和用法： 1. 匹配字符串：使用re.match()函数可以从字符串的起始位置开始匹配一个模式。如果匹配成功，返回一个匹配对象；否则返回None。 2. 搜索字符串：使用re.search()函数可以在整个字符串中搜索匹配一个模式。如果匹配成功，返回一个匹配对象；否则返回None。 3. 查找所有匹配：使用re.findall()函数可以查找字符串中所有匹配一个模式的子串，并返回一个列表。 4. 替换字符串：使用re.sub()函数可以将字符串中匹配一个模式的子串替换为指定的字符串。 5. 切分字符串：使用re.split()函数可以根据一个模式将字符串切分成多个子串，并返回一个列表。 6. 匹配对象的属性和方法：匹配对象具有一些属性和方法，如group()、start()、end()等，可以获取匹配到的子串、匹配子串的起始位置和结束位置等信息。 正则表达式的语法非常灵活，可以用于匹配各种复杂的模式。以下是一些常用的正则表达式元字符： - . ：匹配任意字符（除了换行符） - ^ ：匹配字符串的起始位置 - $ ：匹配字符串的结束位置 - * ：匹配前面的字符零次或多次 - + ：匹配前面的字符一次或多次 - ? ：匹配前面的字符零次或一次 - [] ：匹配括号内的任意一个字符 - () ：标记一个子表达式的开始和结束位置 - | ：匹配两个或多个表达式之一 正则表达式还支持一些特殊的字符类别和转义字符，用于匹配数字、字母、空白字符等特定类型的字符。