正则表达式的使用、 re 模块及分组在re模块中的使用

 

目录

 

模块的定义

模块的类型

re模块

三个查找方法 findall search  match

字符串处理扩展:替换  切割

re模块进阶

compile :节省使用正则表达式解决问题的时间

finditer 节省使用正则表达式解决问题的时间/内存

分组在re模块中的使用

分组命名

正则表达式的使用技巧

匹配整数

匹配标签

爬虫实例 


模块的定义

模块就是功能的集合, 模块是python提供给我们去操作这个内容的方法,这个要操作的内容本来就存在。

例:时间模块 在python中操作时间,在python中显示时间 计算时间

模块的类型

  1. 内置模块:解释器自带的,不需要自己安装
  2. 第三方模块:需要我们自己安装的
  3. 自定义模块:我们自己写的模块

re模块

在python中使用正则表达式,先要导入re模块

三个查找方法 findall search  match

findall:匹配所有能匹配上的,每一项都是列表中的一个元素

语法:findall(正则表达式,待匹配的字符串,flag)

实例:

import re
ret=re.findall('\d+','shdu128wer93')
print(ret)  

结果:
['128', '93']

search:只匹配从左到右的第一个,得到的不是匹配的结果,而是一个变量,通过变量的group方法获取结果。如果没有匹配到会返回None,使用group会报错。

实例:

import re
ret=re.search('\d+','shdu128wer93')

print(ret)#内存地址,这是一个正则匹配的结果 <_sre.SRE_Match object; span=(4, 7), match='128'>
print(ret.group())#通过ret.group()获取真正的结果   128

如果没有匹配到会返回None,使用group会报错。

推荐写法:

ret=re.search('\d+','shdu128wer93')
if ret:
    print(ret.group())  #128

match:从头开始匹配,相当于search中的正则表达式加上'^'

实例:

ret=re.match('\d+','shdu128wer93')
#ret=re.match('^\d+','shdu128wer93')
print(ret)  #None
ret=re.match('\d+','128shduwer93')
#print(ret)  #<_sre.SRE_Match object; span=(0, 3), match='128'>

字符串处理扩展:替换  切割

split:返回列表,按照正则表达式切割,默认匹配到的内容会被切割

实例:

s
  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值