import re
r = re.findall("\d+",'我今年24,大学毕业2年了') # findall从头匹配到尾,但是用的少,因为匹配到的数据可能很大,会很占内存,数据大的时候少用
print(r) # 输出列表:['24', '2']
# 如果用来搜索内容中的一个东西,匹配到一个结果就返回search()
r1 = re.search('\d+','我今年24,大学毕业2年了')
print(r1) # 输出:<re.Match object; span=(3, 5), match='24'>
print(r1.group()) # 输出:24 search查找第一个匹配到的数据,但是匹配到的是个对象,需要用group进行输出
# 爬虫,用finditer()
r2 = re.finditer('\d+','我今年24,大学毕业2年了')
print(r2) # 输出:<callable_iterator object at 0x0225CAC0>,可以看到返回的是个迭代器,用for循环可以拿到
for i in r2:
print(i) # 返回的是<re.Match object; span=(3, 5), match='24'>对象跟上面search一样,需要用group提取数据
print(i.group()) # 输出24
# <re.Match object; span=(3, 5), match='24'>
# 24
# <re.Match object; span=(10, 11), match='2'>
# 2
# match:从头开始匹配,相当于^,因为使用数字匹配,所以第一位一定要是数字,否则匹配不到,用来匹配手机号用
r4 = re.match('\d+','29了,博士毕业2年了')
print('这里是r4',r4) # 输出:这里是r4 <re.Match object; span=(0, 2), match='29'>
print(r4.group()) # 输出:29 从上面可以知道用group(),可以输出内容
# 知识点'r',放字符串前,则默认转义字符不转义(\n,\t。。。)
# (?P<变量>正则表达式)
obj = re.compile(r'我今天语文考了(?P<chengji>\d+)分,(?P<age>\d+)岁的妈妈很爱我',re.S) # re.S:让.能匹配换行符
result = obj.finditer('这次全班22个人都考得不错,我今天语文考了36分,85岁的妈妈很爱我')
for i in result:
print(i.group('chengji')) # 输出:36
print(i.group('age')) # 输出:85
print(i.groupdict()) # 输出:{'chengji': '36', 'age': '85'}
re.findall() # 匹配所有,返回列表
re.finditer() # 匹配所有,返回迭代器,要用for循环打印输出
re.search() # 匹配一个结果就返回
re.match() # 从头开始匹配,匹配到一个就返回
group() 用来取数据,用来finditer,search,match取数据用的
re.compile() # 先把正则加载,然后去用他
() 从正则匹配到的结果中拿到制定数据
(?P<name>正则) 正则匹配到的数据赋值到变量“name”