re.findall() re.finditer()的用法

re.findall(pattern, string, flags=0)

Return all non-overlapping matches of pattern in string, as a list of strings. The string is scanned left-to-right, and matches are returned in the order found. If one or more groups are present in the pattern, return a list of groups; this will be a list of tuples if the pattern has more than one group. Empty matches are included in the result unless they touch the beginning of another match.

返回字符串里所有不重叠的模式串匹配,以字符串列表的形式出现。字符串从左往右被扫描,匹配按被发现的顺序返回。如果有一个或多个群出现在模式串中,返回一个群列表;如果模式串有多个串,这将是元组的列表。空匹配将被包括在结果里,除非他们触碰到另外一个匹配的开头。

re.finditer(pattern, string, flags=0)

Return an iterator yielding MatchObject instances over all non-overlapping matches for the RE pattern in string. The string is scanned left-to-right, and matches are returned in the order found. Empty matches are included in the result unless they touch the beginning of another match.

返回一个产生匹配对象实体的迭代器,能产生字符串中所有RE模式串的非重叠匹配。字符串被从左向右扫描,匹配按发现顺序返回。空字符串被包括在结果中除非它们触碰到另一个匹配的开头。

flags参数是可选参数。如果向它传递re模块中的宏常量,就会对匹配方式产生对应的影响。

 

一个练习,原题链接:Re.findall() & Re.finditer()

import re

vowels = "AEIOUaeiou"
consonants = "QWRTYPSDFGHJKLZXCVBNMqwrtypsdfghjklzxcvbnm"

m = re.findall(r"(?<=[%s])([%s]{2,})(?=[%s])"%(consonants, vowels, consonants), input())

if m:
    print("\n".join(m))
else:
    print("-1")


[] 用于表示一个字符集合。 (?=...) 如果 ... 和目前位置接下来的字符串相同,则匹配成功,但是它不消耗字符串(也就是说,其他模式串也可以使用这些字符进行匹配)。这被称为前看断言(lookahead assertion)。 (?<=...) 如果目前位置之前紧邻的字符串等同于 ... ,则匹配成功。这被称为正面后看断言(positive lookbehind assertion)。 {m,n} 表示匹配m到n个之前正则表达式里的字符,这是个贪心版本,它会匹配尽可能多的字符。

import re

vowels = "AEIOU"
consonants = "QWRTYPSDFGHJKLZXCVBNM"

m = re.findall(r"(?<=[%s])([%s]{2,})(?=[%s])"%(consonants, vowels, consonants), input(), flags=re.I)

if m:
    print("\n".join(m))
else:
    print("-1")

如果 flags=re.I ,表示正则表达式忽略字符的大小写区别。因此代码可做如上修改。

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
re.split函数用于根据正则表达式来分割字符串。它接受两个参数,第一个参数是正则表达式,第二个参数是要进行分割的字符串。这个函数会返回一个列表,其中包含了根据正则表达式分割后的子字符串。 re.finditer函数用于在字符串中查找所有满足正则表达式的非重叠出现,并返回一个迭代器。通过迭代器遍历可以获取到每个匹配到的对象,而每个匹配对象包含了匹配到的字符串以及对应的开始和结束索引。 re.findall函数用于在字符串中查找所有满足正则表达式的非重叠出现,并返回一个列表。这个函数的参数与re.finditer函数相同,但它直接返回一个包含匹配到的所有字符串的列表。 这三个函数可以很方便地用于字符串的处理和分析。通过正则表达式的灵活性,我们可以根据特定模式来对字符串进行分割、查找和提取。re.split函数可用于将一个字符串按照某个模式进行分割,比如可以将一段文字按照空格或标点进行分割成单词。re.finditer函数可以帮助我们在字符串中找到所有满足某个模式的部分,比如可以统计一段文字中出现了多少个特定的单词。re.findall函数则更加简便,可以一次性返回所有匹配的字符串。 总的来说,这三个函数在正则表达式的应用中非常常用,可以通过它们来进行字符串的拆分、提取和匹配,从而实现更灵活和高效的文本处理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值