python的正则模块re

wwanxinghao

已于 2022-09-10 17:07:35 修改

阅读量99

点赞数

分类专栏： python 文章标签： java 前端数据库

于 2022-08-23 08:25:52 首次发布

本文链接：https://blog.csdn.net/wanggaoxingH/article/details/126473258

版权

python 专栏收录该内容

117 篇文章 4 订阅

订阅专栏

import re

r = re.findall("\d+",'我今年24，大学毕业2年了')  # findall从头匹配到尾，但是用的少，因为匹配到的数据可能很大，会很占内存，数据大的时候少用
print(r)  # 输出列表：['24', '2']

# 如果用来搜索内容中的一个东西，匹配到一个结果就返回search()
r1 = re.search('\d+','我今年24，大学毕业2年了')
print(r1)   # 输出：<re.Match object; span=(3, 5), match='24'>
print(r1.group())  # 输出：24  search查找第一个匹配到的数据，但是匹配到的是个对象，需要用group进行输出

# 爬虫，用finditer()
r2 = re.finditer('\d+','我今年24，大学毕业2年了')
print(r2)   # 输出：<callable_iterator object at 0x0225CAC0>，可以看到返回的是个迭代器，用for循环可以拿到
for i in r2:
    print(i)    # 返回的是<re.Match object; span=(3, 5), match='24'>对象跟上面search一样，需要用group提取数据
    print(i.group())  # 输出24
# <re.Match object; span=(3, 5), match='24'>
# 24
# <re.Match object; span=(10, 11), match='2'>
# 2

# match：从头开始匹配，相当于^，因为使用数字匹配，所以第一位一定要是数字，否则匹配不到，用来匹配手机号用
r4 = re.match('\d+','29了，博士毕业2年了')
print('这里是r4',r4)   # 输出：这里是r4 <re.Match object; span=(0, 2), match='29'>
print(r4.group())   # 输出：29 从上面可以知道用group()，可以输出内容

# 知识点'r',放字符串前，则默认转义字符不转义（\n,\t。。。）
# (?P<变量>正则表达式)
obj = re.compile(r'我今天语文考了(?P<chengji>\d+)分，(?P<age>\d+)岁的妈妈很爱我',re.S)  # re.S：让.能匹配换行符
result = obj.finditer('这次全班22个人都考得不错，我今天语文考了36分，85岁的妈妈很爱我')
for i in result:
    print(i.group('chengji')) # 输出：36
    print(i.group('age'))  # 输出：85
    print(i.groupdict())  # 输出：{'chengji': '36', 'age': '85'}

re.findall() # 匹配所有，返回列表

re.finditer() # 匹配所有，返回迭代器，要用for循环打印输出

re.search() # 匹配一个结果就返回

re.match() # 从头开始匹配，匹配到一个就返回

group() 用来取数据，用来finditer，search，match取数据用的

re.compile() # 先把正则加载，然后去用他

（）从正则匹配到的结果中拿到制定数据

(?P<name>正则) 正则匹配到的数据赋值到变量“name”