python re findall_整理】Python中的re.search和re.findall之间的区别和联系 + re.finall中带命名的组,不带命名的组,非捕获的组,没有分组四种类型之间的...

之前自己曾被搞晕过很多次。

后来使用这些函数次数多了之后,终于比较清楚的弄懂了两者之间的区别和关系了。

尤其是一些细节方面的注意事项了。

在看下面的总结和代码之前,请先确保你对如下基本概念已经有所了解了:

下面,简单总结如下:

re.search和re.findall的区别和联系函数返回结果常见的获得对应的值的方法常见疑问及解答

re.search一个Match对象通过Match对象内的group编号或命名,获得对应的值问:为何search只匹配到一项,而不是所有匹配的项? 答:因为search本身的功能就是: 从左到右,去计算是否匹配,如果有匹配,就返回。 即只要找到匹配,就返回了。 所以,最多只会匹配一个, 而不会匹配多个。 想要匹配多个,请去使用re.findall

re.findall一个列表;列表中每个元素的值的类型,取决于你的正则表达式的写法是元组tuple:当你的正则表达式中有(带捕获的)分组(简单可理解为有括号)而tuple的值,是各个group的值所组合出来的

是字符串:当你的正则表达式中没有捕获的组(不分组,或非捕获分组)字符串的值,是你的正则表达式所匹配到的单个完整的字符串直接获得对应的列表 每个列表中的值,一般就是你想要的值了参见下面的详细解释,需要注意四种不同类型的正则表达式的效果的区别。

其中,对于re.findall,又需要特殊注意四种不同类型的正则表达式的效果,都不太一样:re.finall使用正则表达式的类型返回值的类型 相同点返回值的区别用途

不分组=no group都是返回列表类型的值列表中每个值,都是完整匹配的字符串适用于,先通过此种方法获得对应的完整匹配到的字符串,然后再针对每个字符串,提取所需的(对应的每个域,每个组)的值

非捕获分组=non-capturing group都是返回列表类型的值列表中每个值,都是完整匹配的字符串同上,只不过是从正则表达式的形式上,和分组的类型(不带命名的组或带命名的组)中,一一对应,方便逻辑是理解后续所要处理的值

不带命名的分组=unnamed group都是返回列表类型的值列表中每个值,都是元祖(tuple)类型的值,内容是每个分组的值的组合适用于,直接通过findall,就可以获得多个匹配的字符串中,每个字符串中特定的组的内容,省却了再次通过re.search再去提取的工作了

带命名的分组=named group都是返回列表类型的值列表中每个值,都是元祖(tuple)类型的值,内容是每个分组的值的组合同上,但是在正则表达式的形式上,更容易看清楚各个分组的含义

如何深入理解上述的含义,则需要代码详细的演示:

【总结】

最简单的总结为:

re.search用来查找,单个的字符串,从中提取所需的,不同域值,即不同group的值;

re.findall,一次性提前多个匹配到单个完整的字符串(可以后续接着用re.search再去提取不同group的值)

一个tuple值,其中包括了每个group的值 -> 省却了在用re.search提起不同组的值

各位可以根据自己的需要,选择不同的函数。

另外,再提醒一点,我之前就是遇到过一个情况:

即需要获得多个匹配的,每个单个的完整字符串(图片的地址);

也需要针对每个图片的地址,下载对应的图片,并且提取出其中不同的域值;

此时,就没法使用 re.findall+带命名的分组,去实现了。

只能是通过上述的:

先用re.findall,获得匹配的,每个的单个字符串;

然后针对每个单个字符串,再去做对应的下载图片,用re.search提取所需域值。

所以,还是那句话,需要根据你自己的实际需求,选择合适的函数,实现你所要的功能。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值