[Python]正则表达式re库

最新推荐文章于 2022-12-30 17:19:27 发布

梦视空

最新推荐文章于 2022-12-30 17:19:27 发布

阅读量219

点赞数

分类专栏：学习笔记

本文链接：https://blog.csdn.net/qq_44748994/article/details/105588060

版权

学习笔记专栏收录该内容

3 篇文章 0 订阅

订阅专栏

在线正则表达式测试网址：https://tool.oschina.net/regex/#

在这里插入图片描述

re

re.match：尝试从字符串起始位置匹配一个模式

re.match(pattern,string,fkags=0) ：正则，目标字符串，匹配模式

import re

最常规的匹配

content = 'Hello 123 4567 World_This is a Regex Demo'
print(len(content))
result = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}.*Demo$',content)
print(result)
print(result.group())           #返回结果
print(result.span())            #结果的匹配范围

泛匹配

content = 'Hello 123 4567 World_This is a Regex Demo'
result = re.march('^Hello.*Demo&')
print(result)
print(result.group())           #返回结果
print(result.span())            #结果的匹配范围

获取匹配目标：()括起来

content = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^Hello\s(\d+)\sWorld.*Demo$',content)
print(result)
print(result.group(1))          #返回结果（ 第一个括号匹配到的内容(\d+) ）
print(result.span())            #结果的匹配范围

贪婪匹配：.*————匹配尽可能多的字符

content = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^He.*(\d+).*Demo$',content)  #只能保证匹配到1个数字，也就是7
print(result)
print(result.group(1))          #返回结果（ 第一个括号匹配到的内容(\d+) ）
print(result.span())            #结果的匹配范围

非贪婪匹配：.*?————匹配尽可能少的内容

content = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^He.*?(\d+).*Demo$',content)  #只能保证匹配到1个数字，也就是7
print(result)
print(result.group(1))          #返回结果（ 第一个括号匹配到的内容(\d+) ）
print(result.span())            #结果的匹配范围

匹配模式

content = 'Hello 1234567 World_This \
is a Regex Demo\
'
result = re.match('^He.*?(\d+).*?Demo$',content,re.S) #指定re.S后 .*可以匹配任意字符（包括换行符）
print(result)
print(result.group(1)) 

#----输出----不加re.S
None

#----输出----加re.S
1234567

转义：匹配特殊字符（反斜杠）

content = 'price is $5.00'
result = re.match('price is \$5\.00',content)

总结：尽量使用泛匹配、使用括号得到匹配目标、尽量使用非贪婪模式、有换行就用re.S

re.search（扫描整个字符串返回第一个成功匹配）

content = 'Extra strings Hello 1234567 World_This is a Regex Demo'
result = re.match('^He.*?(\d+).*Demo$',content)  
print(result)


#-----输出-----
None         #开头不匹配

content = 'Extra strings Hello 1234567 World_This is a Regex Demo'
result = re.search('^He.*?(\d+).*Demo$',content)  
print(result)
print(result.group(1))          
print(result.span())

总结：为了匹配成功，能用search就不用match

匹配html练习

梦视空

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[Python]正则表达式re库

在线正则表达式测试网址：https://tool.oschina.net/regex/#rere.match：尝试从字符串起始位置匹配一个模式re.match(pattern,string,fkags=0) ：正则，目标字符串，匹配模式import re最常规的匹配content = 'Hello 123 4567 World_This is a ...
复制链接

扫一扫