正则split 以及 finditer 和 findall 的区别

1 篇文章 0 订阅
1 篇文章 0 订阅

re.split 函数
    re.split(pattern,str,maxsplit=0,flags=0)
参数:
    pattern:cpmpile生成的正则表达式对象,或者自定义的也可以
    str:要匹配的字符串
    maxsplit:最大分割次数,不指定将全部分割
    flags参数:
    re.I(re.IGNORECASE) 使匹配对大小写不敏感
    re.L(re.LOCAL)  做本地化识别(locale-aware)匹配
    re.M(re.MULTILINE)  多行匹配,影响 ^ 和 $
    re.S(re.DOTALL) 使 . 匹配包括换行在内的所有字符
    re.U(re.UNICODE)    根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
    re.X(re.VERBOSE)    该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。
eq:
    import re

    str = 'say hello world!'
    str_nm = 'one1two2three3'
    pattern = re.compile(r'\s')
    pattern_nm = re.compile(r'\d+')
    match = re.split(pattern,str)
    match_nm = re.split(pattern_nm,str_nm)
结果:
    ['say', 'hello', 'world!']
    ['one', 'two2three3']

    
    
re.finditer(pattern,string)函数
    finditer返回的是一个可迭代对象,里面的元素也是可迭代对象,要使用group()
    findall返回的是一个列表,里面的元素是匹配到的字符串

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
re.split函数用于根据正则表达式来分割字符串。它接受两个参数,第一个参数是正则表达式,第二个参数是要进行分割的字符串。这个函数会返回一个列表,其中包含了根据正则表达式分割后的子字符串。 re.finditer函数用于在字符串中查找所有满足正则表达式的非重叠出现,并返回一个迭代器。通过迭代器遍历可以获取到每个匹配到的对象,而每个匹配对象包含了匹配到的字符串以及对应的开始和结束索引。 re.findall函数用于在字符串中查找所有满足正则表达式的非重叠出现,并返回一个列表。这个函数的参数与re.finditer函数相同,但它直接返回一个包含匹配到的所有字符串的列表。 这三个函数可以很方便地用于字符串的处理和分析。通过正则表达式的灵活性,我们可以根据特定模式来对字符串进行分割、查找和提取。re.split函数可用于将一个字符串按照某个模式进行分割,比如可以将一段文字按照空格或标点进行分割成单词。re.finditer函数可以帮助我们在字符串中找到所有满足某个模式的部分,比如可以统计一段文字中出现了多少个特定的单词。re.findall函数则更加简便,可以一次性返回所有匹配的字符串。 总的来说,这三个函数在正则表达式的应用中非常常用,可以通过它们来进行字符串的拆分、提取和匹配,从而实现更灵活和高效的文本处理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值