python的正则模块re

import re

r = re.findall("\d+",'我今年24,大学毕业2年了')  # findall从头匹配到尾,但是用的少,因为匹配到的数据可能很大,会很占内存,数据大的时候少用
print(r)  # 输出列表:['24', '2']

# 如果用来搜索内容中的一个东西,匹配到一个结果就返回search()
r1 = re.search('\d+','我今年24,大学毕业2年了')
print(r1)   # 输出:<re.Match object; span=(3, 5), match='24'>
print(r1.group())  # 输出:24  search查找第一个匹配到的数据,但是匹配到的是个对象,需要用group进行输出

# 爬虫,用finditer()
r2 = re.finditer('\d+','我今年24,大学毕业2年了')
print(r2)   # 输出:<callable_iterator object at 0x0225CAC0>,可以看到返回的是个迭代器,用for循环可以拿到
for i in r2:
    print(i)    # 返回的是<re.Match object; span=(3, 5), match='24'>对象跟上面search一样,需要用group提取数据
    print(i.group())  # 输出24
# <re.Match object; span=(3, 5), match='24'>
# 24
# <re.Match object; span=(10, 11), match='2'>
# 2

# match:从头开始匹配,相当于^,因为使用数字匹配,所以第一位一定要是数字,否则匹配不到,用来匹配手机号用
r4 = re.match('\d+','29了,博士毕业2年了')
print('这里是r4',r4)   # 输出:这里是r4 <re.Match object; span=(0, 2), match='29'>
print(r4.group())   # 输出:29 从上面可以知道用group(),可以输出内容

# 知识点'r',放字符串前,则默认转义字符不转义(\n,\t。。。)
# (?P<变量>正则表达式)
obj = re.compile(r'我今天语文考了(?P<chengji>\d+)分,(?P<age>\d+)岁的妈妈很爱我',re.S)  # re.S:让.能匹配换行符
result = obj.finditer('这次全班22个人都考得不错,我今天语文考了36分,85岁的妈妈很爱我')
for i in result:
    print(i.group('chengji')) # 输出:36
    print(i.group('age'))  # 输出:85
    print(i.groupdict())  # 输出:{'chengji': '36', 'age': '85'}

re.findall()        # 匹配所有,返回列表

re.finditer()         # 匹配所有,返回迭代器,要用for循环打印输出

re.search()        # 匹配一个结果就返回

re.match()        # 从头开始匹配,匹配到一个就返回

group()         用来取数据,用来finditer,search,match取数据用的

re.compile() # 先把正则加载,然后去用他

() 从正则匹配到的结果中拿到制定数据

(?P<name>正则) 正则匹配到的数据赋值到变量“name”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值