Python--正则学习--组

1.组的概念

import re
#这里侧重讲解正则中组的概念
resource ="固定电话1:0518-888888888,固定电话2:0519-99999999"
#获取区号
pattern_nogroup ='[^0-9]{4}\d:\d{4}'
result_nogroup = re.findall(pattern_nogroup,resource)
print(result_nogroup)
print("********************************************************")
pattern_group='[^0-9]{4}\d:(\d{4})'
result_group = re.search(pattern_group,resource)
print("group():"+result_group.group())
print("group(0):"+result_group.group(0))
print("group(1):"+result_group.group(1))
print("********************************************************")
result_group_findall = re.findall(pattern_group,resource)
print(result_group_findall)

运行结果:

['固定电话1:0518', '固定电话2:0519']
********************************************************
group():固定电话1:0518
group(0):固定电话1:0518
group(1):0518
********************************************************
['0518', '0519']

从结果中可以看出当正则表达式中没有()时,结果输出为整段满足的文本。而当正则表达式中有()时,结果只输出()中的部分。同时当不存在()时,默认为group()或group(0),而存在()时,对应的是group(n)。同时还可以看出re.search()和re.findall()方法的区别在于search方法只会输出一个满足正则的结果,而findall方法会输出所有满足正则的结果。

所以可以认为正则中组就是(),当不存在()时,为0组,当存在时组的序号随着()的数量变化。

2.多组情况分析

1.当存在多个平级()时

#分别获得区号和电话号码
import re
resource ="固定电话1:0518-888888888,固定电话2:0519-99999999"
pattern_groups='(\d{4})-(\d{8})'
result_groups_search = re.search(pattern_groups,resource)
print("group(0): "+result_groups_search.group(0))
print("group(1): "+result_groups_search.group(1))
print("group(2): "+result_groups_search.group(2))
result_groups_findall=re.findall(pattern_groups,resource)
print(result_groups_findall)

运行结果:

group(0): 0518-88888888
group(1): 0518
group(2): 88888888
[('0518', '88888888'), ('0519', '99999999')]

从运行结果可以看出当正则表达式中存在多个平级()时,组的序号从左向右依次增加。当使用findall方法时,返回的为元组列表,元组中元素依次为每个组的值。

2.当存在嵌套()时

#分别获得区号和电话号码
import re
resource ="固定电话1:0518-888888888,固定电话2:0519-99999999"
pattern_groups1='((\d{4})-\d{8})'
result_groups_search1 = re.search(pattern_groups1,resource)
print("group(0): "+result_groups_search1.group(0))
print("group(1): "+result_groups_search1.group(1))
print("group(2): "+result_groups_search1.group(2))
result_groups_findall1=re.findall(pattern_groups1,resource)
print(result_groups_findall1)

运行结果:

group(0): 0518-88888888
group(1): 0518-88888888
group(2): 0518
[('0518-88888888', '0518'), ('0519-99999999', '0519')]

从运行结果可以看出当正则表达式中存在嵌套()时,组的序号从外向内依次增加。

3.当既存在平级()又存在嵌套()时

#分别获得区号和电话号码
import re
resource ="固定电话1:0518-888888888,固定电话2:0519-99999999"
pattern_groups2='((\d{4})-(\d{8}))'
result_groups_search2 = re.search(pattern_groups2,resource)
print("group(0): "+result_groups_search2.group(0))
print("group(1): "+result_groups_search2.group(1))
print("group(2): "+result_groups_search2.group(2))
print("group(3): "+result_groups_search2.group(3))
result_groups_findall2=re.findall(pattern_groups2,resource)
print(result_groups_findall2)

运行结果:

group(0): 0518-88888888
group(1): 0518-88888888
group(2): 0518
group(3): 88888888
[('0518-88888888', '0518', '88888888'), ('0519-99999999', '0519', '99999999')]

从运行结果看当存在组合()时,组的序号是根据从左向右的顺序依次增加的。

3总结

正则中组就是正则表达式中的(),其作用是只提取()中满足的内容。当存在复杂()时,根据(从左向右依次数数作为组的序号进行提取。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱学习_程序员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值