python 学习第十二天(re模块)

re模块

  • 功能
    做模糊匹配
  • 元字符
元字符功能
.匹配除了换行符以外的任意字符
^从字符串首位匹配。书写时必须写在首位,否则匹配为空
$从字符串末尾匹配。书写时必须写在末尾,否则匹配为空
*重复匹配任意多次(包括0次)
+重复匹配任意多次(不包括0次)
?匹配0次或1次
{n}n是一个非负整数。匹配确定的n次
{n,}至少匹配n次
{n,m}m和n均为非负整数,其中n<=m。最少匹配n次且最多匹配m次
[xyz]字符集。匹配字符集中任何一个字符,除注释1的字符.(注释1)
\反斜杠。使元字符失去特殊功能;使部分普通字符实现特殊功能(注释2)。
( )将( ) 之间的表达式定义为“组”(group),并且将匹配这个表达式的字符保存到一个临时区域。(注释3)
|将两个匹配条件进行逻辑“或”(Or)运算
  • 注释1
    1. -在[]里表示范围,比如[a-z]表示匹配a到z中的任意一个字符。 如果此时还需要匹配 - ,那么再在 [ ]里面加一个-(加在前后都可以),比如[a-z-],这时候就能匹配到 - 。
    2. ^ 则表示取反的意思。比如 [^a,b] 表示除了 a , b(注意:这里的’,’也是一个字符,没有其他的意义) 以外所有的字符都匹配(包括换行符)
    3. \在[]中还是有元字符的意义
 import re
 print(re.findall('a[1-9-]+','a1999-9'))  # ['a1999-9']
  • 注释2
    \d 匹配任何十进制的数,相当于 [0-9]
    \D 匹配任何非数字字符,相当于 [^0-9]
    \s 匹配任何空白字符,相当于 [ \t\n\r\f\v]
    \S 匹配任何非空白字符,相当于 [^ \t\n\r\f\v]
    \w 匹配任何字母和数字字符,相当于 [0-9a-zA-Z]
    \W 匹配任何非字母和数字字符,相当于 [^0-9a-zA-Z]
    \b 匹配一个特殊边界(非任何字母和数字的都是特殊字符)
  • 注释3

import re

print(re.search('(?P<name>[a-z]+)(?P<age>\d+)','chengzhuo24zhuo25').group())    #chengzhuo24

print(re.search('(?P<name>[a-z]+)(?P<age>\d+)','chengzhuo24zhuo25').group('name')   #chengzhuo

print(re.search('(?P<name>[a-z]+)(?P<age>\d+)','chengzhuo24zhuo25').group('age'))   #24


#  (?P<>re)相当于给分组起名字,后面跟的内容才是要匹配的

print(re.findall('www\.(163|baidu)\.com','assadwww.baidu.comsfasfd'))
#['baidu']  这是因为优先显示分组的内容
print(re.findall('www\.(?:163|baidu)\.com','assadwww.baidu.comsfasfd'))
#['www.baidu.com']  (?:re)表示()不是一个分组
  • 注释4
    *+?{}都是贪婪匹配,加问号就可以变成惰性匹配

 import re

 print(re.findall('as+?','asssss'))          #['as']

 print(re.findall('as+','asssss'))         #['asssss']
  • 常用方法
    • re.findall(pattern,str)
      返回一个满足条件的所有结果的列表
    • re.search(pattern,str)
      返回一个对象,这个对象是满足条件的第一个匹配结果。取出匹配的字符串用这个对象的group()方法。
    • re.match(pattern,str)
      同search,但它只在字符串的开始匹配
    • re.split(pattern,str)
      分割
print(re.split('a|ac|b','nnnannnacnnnnbnnnannn'))
#['nnn', 'nnn', 'cnnnn', 'nnn', 'nnn']
    • re.sub()
      替换
print(re.sub('a|ac|b','Y','nnnannnacnnnnbnnnannn'))
# nnnYnnnYcnnnnYnnnYnnn
    • re.subn()
print(re.subn('a|ac|b','Y','nnnannnacnnnnbnnnannn'))
#('nnnYnnnYcnnnnYnnnYnnn', 4) 4是匹配到的次数
    • re.compile(pattern)
      返回一个规则对象
com=re.compile('[AV]+')
print(com.findall('AVjkhjjAhijkV'))
#['AV', 'A', 'V']
    • re.finditer()
      与findall()类似,但返回的是一个迭代器
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在Python中,re模块的分组是指将正则表达式中的一部分括起来,形成一个组,以便于后续的重复使用、替换或者匹配。分组可以通过在正则表达式中使用括号来实现,例如: ```python import re # 匹配一个由3个数字组成的字符串 pattern = re.compile(r'(\d{3})') result = pattern.search('abc123def') print(result.group()) # 123 print(result.group(1)) # 123 ``` 在上面的例子中,正则表达式中的`\d{3}`表示匹配3个数字,而`(\d{3})`则表示将匹配结果分组,以便于后续的使用。在`search`方法返回的结果中,`group()`表示获取整个匹配结果,而`group(1)`则表示获取第一个分组的匹配结果(即三个数字)。 ### 回答2: 在Python中,re模块是一个用于正则表达式匹配和操作的模块。在re模块中,可以使用括号来创建分组。 分组允许将正则表达式的一部分标记为一个单独的组,并且可以在匹配成功后对分组进行提取和操作。分组有以下两个主要的作用: 1. 子组匹配:通过使用括号将一部分正则表达式标记为一个组,可以将该组视为一个单独的子表达式,并对其进行匹配。例如,正则表达式"(ab)+"将匹配一个或多个连续的"ab",这里的"(ab)"就是一个分组。 2. 分组提取:在匹配成功后,可以使用分组从匹配的字符串中提取指定分组的内容。通过使用括号创建分组,可以使用group()方法来获取每个分组的内容,也可以使用group(1)、group(2)等来获取指定分组的内容。 例如,假设有一个字符串"my email is [email protected]",我们想要匹配其中的电子邮件地址。可以使用正则表达式"(\w+)@(\w+.\w+)"来匹配电子邮件地址。这里,(\w+)表示第一个分组,用于匹配邮件地址的用户名部分;@表示电子邮件地址中的@符号;(\w+.\w+)表示第二个分组,用于匹配邮件地址的域名部分。 通过使用group()方法或group(1)、group(2)等可以获取匹配结果的分组内容。例如,使用group(1)可以获取用户名部分"test",使用group(2)可以获取域名部分"example.com"。 总结起来,re模块中的分组允许将正则表达式的一部分标记为一个单独的组,并可以通过group()方法提取匹配结果中的指定分组内容。这样可以方便地对匹配结果进行操作和提取所需信息。 ### 回答3: python中re模块的分组是指在正则表达式中使用小括号将匹配的模式分组。分组的作用可以有以下几点: 1. 提取匹配的内容:使用小括号将需要提取的部分括起来,通过分组可以轻松获取匹配到的内容。例如,正则表达式r'(\d+)-(\d+)'可以匹配类似"2019-2020"这样的字符串,通过分组可以分别获取到"2019"和"2020"。 2. 子表达式匹配:分组可以创建子表达式,用于组合多个正则元字符,实现更复杂的匹配。例如,正则表达式r'(abc)+\w'可以匹配多个"abc"开头,再跟上一个字母的字符串,例如"abcabcx"。 3. 分组引用:使用小括号可以为分组定义索引编号,方便在后续的匹配中引用。通过\数字的方式引用分组,可以在后续的正则中重复使用分组匹配到的内容。例如,正则表达式r'(\d+)-\1'可以匹配类似"2020-2020"的字符串。 4. 分组命名:除了通过索引编号引用分组外,还可以为分组定义名称,以提高可读性。使用语法形式(?P<name>...)来为分组命名,并通过命名引用分组。例如,正则表达式r'(?P<year>\d+)-(?P<month>\d+)'可以匹配类似"2020-12"的字符串,并分别以"year"和"month"作为键获取匹配到的内容。 总的来说,re模块中的分组功能使得我们可以更加灵活地处理正则表达式匹配的结果,提高代码的可读性和可维护性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值