正则表达式学习进程（一）re.match()

最新推荐文章于 2023-12-07 02:56:28 发布

凯旋的皇阿玛

最新推荐文章于 2023-12-07 02:56:28 发布

阅读量1.6k

点赞数 1

分类专栏： python 文章标签： python re.match

本文链接：https://blog.csdn.net/qq1195365047/article/details/79770093

版权

python 专栏收录该内容

22 篇文章 0 订阅

订阅专栏

#正则表达式学习笔记
import re

"""
.匹配任意字符 除换行符
{n}精确匹配前面n个表达式
\s 匹配任意的空白字符
\w 匹配字母数字及下划线
.* 匹配任意除换行符之外的字符
{n}    精确匹配n个前面表达式。
+  匹配1个或多个的表达式。
( )    匹配括号内的表达式
?  匹配0个或1个由前面的正则表达式定义的片段，非贪婪方式
re.S 如果不使用re.S参数,则只在每一行内进行匹配,如果一行没有,就换下一行重新开始,不会跨行
"""

#re.match() 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()返回none

#用法：re.match(pattern,string ,flags=0)  flags标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。
"""
1.string与pattern完全相同,成功匹配 
2.string虽然多出一个字母，但pattern匹配完成时，匹配成功，后面的字符不再匹配。 
3.string匹配到最后一个字母时，发现仍然无法完全匹配，匹配失败。 

"""
content ='Hello 123 4567 World_This is a Regex Demo'
contents ='Hello 123 4567 World_This is a Regex Demo  ada'
result = re.match('Hello\s\d{3}\s\d{4}\s\w{10}.*Demo$', content)
print(result)
print(type(result))#<class '_sre.SRE_Match'>
print(len(content))
print(result.group())#返回匹配结果 Hello 123 4567 World_This is a Regex Demo
print(result.span())#输出范围 （0,41）
result = re.match('Hello\s\d{3}\s\d{4}\s\w{10}.*Demo', contents)
print(result)  #结果：<_sre.SRE_Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'>

#泛匹配
result =  re.match('Hello.*Demo$',content)
print(result)  #<_sre.SRE_Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'>
print(result.group())  #Hello 123 4567 World_This is a Regex Demo

#匹配目标
content ='Hello 1234567 World_This is a Regex Demo'
result = re.match('Hello\s(\d+)\sWorld.*Demo$',content)
#匹配括号里面的
print("############")
print(result.group())
print(result.group(1)) #1234567
print(result.span())   #(0,40)

#贪婪匹配
result = re.match('He.*(\d+).*Demo$',content)
print(result.group())
print(result.group(1)) #输出7  前面的1-6被.*匹配，贪婪模式

#非贪婪模式
result1 = re.match('He.*?(\d+).*Demo$',content)
result2 = re.match('He.*?(\d+).*?Demo$',content)
print(result2.group(1)) #
print(result1.group(1)) #输出1234567



#匹配模式
content = """Hello 1234567 World_This 
is a Regex Demo
"""
result1 = re.match('^He.*?(\d+).*?Demo$', content)
print(result1) #输出None  因为有换行符
result2 = re.match('^He.*?(\d+).*?Demo$', content,re.S)
print(result2) #输出None
print(result2.group(1))#1234567

#转义

content = 'price is $5.00'
result = re.match('price is $5.00',content)
print(result) #None
result = re.match('price is \$5\.00', content)
print(result)#<_sre.SRE_Match object; span=(0, 14), match='price is $5.00'>

"""
总结：尽量使用泛匹配，使用()得到匹配目标，尽量使用非贪婪模式、有换行符就用re.S
"""