python的正则表达式匹配如何找到所有匹配成功的部分（包括重叠的）

最新推荐文章于 2024-06-22 09:36:52 发布

lwgkzl

最新推荐文章于 2024-06-22 09:36:52 发布

阅读量3.2k

点赞数 2

分类专栏： # python 文章标签： python 正则表达式

本文链接：https://blog.csdn.net/lwgkzl/article/details/105709890

版权

python 专栏收录该内容

45 篇文章 8 订阅

订阅专栏

比如： st = “平安夜吃苹果呀小菇凉” , pattern = '((平|苹).*?果)‘

我希望匹配的字符串是 "平安夜吃苹果" 以及 “苹果” 很显然后面那个是包含在前面一个字符串中的。

解决方式有两种：

1. ?= 原理暂时我没有弄清楚，请路过的大佬指点

在这个pattern的周围加上一个?=,然后套一个分组括号。详见代码：

st = "平安夜吃苹果呀小菇凉"
pattern = '(?=((平|苹).*?果))'
finditer = re.finditer(pattern,st)
for f in finditer:
    print(f.group(1))

2. 把python的re模块升级为regex模块，这个regex里面有个overlapped的选项，将这个选项置为True就行。

import regex
st = "平安夜吃苹果呀小菇凉"
pattern = '((平|苹).*?果)'
finditer = regex.finditer(pattern,st,overlapped=True)
for f in finditer:
    print(f.group(1))

以上

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lwgkzl

关注关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python 正则表达式-匹配规则

zhangweiye068的博客

08-23

1万+

正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。 Python 自1.5版本起增加了re 模块，它提供 Perl 风格的正则表达式模式。 re 模块使 Python 语言拥有全部的正则表达式功能。 compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。 re 模块也提供了与这些方法功能完...

Python爬虫基础——re模块的提取、匹配和替换

WoLykos

12-19

2247

re是Python的一个第三方库。为了能更直观的看出re的效果，我们先新建一个HTML网页文件（可直接复制）： index.html <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Title</title> <...

参与评论您还未登录，请先登录后发表或查看评论

python之正则findall函数（匹配成功立刻返回）

心猿问道的博客

08-30

720

Python一文轻松搞定正则匹配

zyp626的博客

06-22

3303

日常工作中，不可避免需要进行文件及内容的查找，替换操作，python的正则匹配无疑是专门针对改场景而出现的，灵活地运用可以极大地提高效率，下图是本文内容概览。。

python正则匹配字符串列表_在python中使用正则表达式查找可嵌套字符串组

weixin_39858275的博客

12-06

669

在网上看到一个小需求，需要用正则表达式来处理。原需求如下：找出文本中包含”因为……所以”的句子，并以两个词为中心对齐输出前后3个字，中间全输出，如果“因为”和“所以”中间还存在“因为”“所以”，也要找出来，另算一行，输出格式为：行号前面3个字 *因为* 全部 &所以& 后面3个字(标点符号算一个字)2 还不是 *因为* 这里好， &所以& 没有人实现方法如下：#e...

python 正则表达式实现重叠匹配

qq_43650934的博客

07-11

1938

import regex string = '100101010001' str_re = '101' print(regex.findall(str_re, string, overlapped=True)) 普通的re库匹配，只能匹配一个’101’。

第11.25节 Python正则表达式编译re.compile及正则对象使用.rar

09-16

总结，`re.compile()`是Python正则表达式的重要工具，它使得我们可以预先编译正则表达式模式，提高程序的效率和可读性。通过创建正则表达式对象，我们可以灵活地执行多种正则操作，如查找、替换和分割字符串，从而在...

Python正则表达式基础

04-02

Python正则表达式是Python编程语言中的一个强大工具，用于处理和分析文本字符串。它允许开发者通过模式匹配来查找、替换或提取数据，广泛应用于数据清洗、文本挖掘、日志分析等领域。在Python中，正则表达式主要通过...

Python正则表达式学习小例子

09-17

### Python正则表达式学习小例子详解 #### 正则表达式简介 正则表达式是一种强有力的模式匹配工具，用于文本处理。它不是Python特有的功能，但Python中的实现提供了丰富的特性和灵活性，使得正则表达式的使用变得...

Python正则表达式七种兵器

12-04

Python正则表达式是Python编程语言中的一个强大工具，它用于处理字符串，通过模式匹配来查找、替换或提取文本信息。在Python中，正则表达式主要由`re`模块提供支持。本教程将深入探讨Python正则表达式的七种核心功能...

Python正则表达式视频

08-29

7. **Python re模块**：讲解`re`模块中的函数，如`match()`（从字符串开始位置匹配）、`search()`（在整个字符串中搜索第一个匹配项）、`findall()`（找到所有非重叠匹配项并返回列表）、`sub()`（替换匹配的子串）...

python 中的re模块

tumantou2hao的博客

03-16

470

参考文章https://blog.csdn.net/github_38196368/article/details/70456082 Python 的 re 模块（Regular Expression 正则表达式）提供各种正则表达式的匹配操作，在文本解析、复杂字符串分析和信息提取时是一个非常有用的工具。 1.re的简介使用python的re模块，尽管不能满足所有复杂的匹配情况，但足够在绝大多数情...

三十二、(重点)正则表达式1：re模块（re.match、group()）、正则表达式单字符匹配、正则数量（{m}、{m,n}）

xk1761299425的博客

08-09

6241

一、re模块（re.match、group()方法） 1、 2、re.match() 能够匹配出以xxx开头的字符串（从左到右开始依次匹配） 3、若匹配成功，返回字符串的匹配成功的部分，同时可以使用group方法来提取具体的数据。二、正则表达式的单字符匹配（只匹配1个字符） 1、. 匹配任意1个字符(除了\n都能匹配)——（例如#、？都能匹配）校验一下你字符串当中够...

Python正则(1)re.match\search\findall\finditer方法

chl183的博客

04-24

270

Python3 正则表达式re.match函数 正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。 Python 自1.5版本起增加了re 模块，它提供 Perl 风格的正则表达式模式。 re 模块使 Python 语言拥有全部的正则表达式功能。 re.match函数 re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match...

三、python高级：正则表达式

weixin_42834609的博客

08-11

890

一、re模块（re.match、group()方法） 1、 2、re.match() 能够匹配出以xxx开头的字符串（从左到右开始依次匹配）若匹配成功，则返回匹配对象（Match Object），否则返回None， group方法，用来返回字符串的匹配成功的部分。 3、match方法有一个特点：校验的字符串从左往右去匹配规则，在这个匹配的过程中只要满足了全部的规则，即使要校验的...

python第五章模块简介以及使用方法

Huahuacccc的博客

12-02

400

5.1sys模块定义 sys模块主要负责与Python解释器进行交互常用方法 import sys #如何查看sys里面有哪些方法 #help(sys) #利用以上的不直观，我们可以dir print(dir(sys)) 属性或方法描述 sys.argv 获取命令行参数列表，第一个参数是程序本身 sys.exit(n) 退出 Python 程序，exit(0) 表示正常退出。当参数非 0 时,会引发一个 SystemExit 异常，可以在程序中捕获该异

python RE的match()和group()疑问

weixin_33836874的博客

02-17

609

python RE的match()和group()疑问>>m=re.match(r"(..)+","a1b2c3")#Matches3times. >>m.group(1)#Returnsonlythelastmatch. 'c3' >>m.group(0) 'a1b2c3' &...

【python学习笔记】re模块（正则表达式）

是安澜啊

09-24

1627

目录前言： re模块的主要方法特殊符号与字符 re.compile方法 re.findall方法 re.sub方法前言： 正则表达式(regex)是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 re模块的主要方法 Python自带的re模块主要包含如下6种方法： re.compile: 编译一个正则表达式模式(pattern)； re.match: 从头开始匹配, 使用group()方法可以获取第一个匹配值； re.search: 用包含方.

python 正则匹配中re.match().group(num=0)

loveWEBmin's blog

09-18

4719

import re a = "123abc456" print re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0) #123abc456,返回整体 print re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(1) #123 print re.search("([0-9]*)([a-z]*)(...

python 正则表达式重叠匹配