正则表达式学习进程(一)re.match()

#正则表达式学习笔记
import re

"""
.匹配任意字符 除换行符
{n}精确匹配前面n个表达式
\s 匹配任意的空白字符
\w 匹配字母数字及下划线
.* 匹配任意除换行符之外的字符
{n}    精确匹配n个前面表达式。
+  匹配1个或多个的表达式。
( )    匹配括号内的表达式
?  匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式
re.S 如果不使用re.S参数,则只在每一行内进行匹配,如果一行没有,就换下一行重新开始,不会跨行
"""

#re.match() 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()返回none

#用法:re.match(pattern,string ,flags=0)  flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。
"""
1.string与pattern完全相同,成功匹配 
2.string虽然多出一个字母,但pattern匹配完成时,匹配成功,后面的字符不再匹配。 
3.string匹配到最后一个字母时,发现仍然无法完全匹配,匹配失败。 

"""
content ='Hello 123 4567 World_This is a Regex Demo'
contents ='Hello 123 4567 World_This is a Regex Demo  ada'
result = re.match('Hello\s\d{3}\s\d{4}\s\w{10}.*Demo$', content)
print(result)
print(type(result))#<class '_sre.SRE_Match'>
print(len(content))
print(result.group())#返回匹配结果 Hello 123 4567 World_This is a Regex Demo
print(result.span())#输出范围 (0,41)
result = re.match('Hello\s\d{3}\s\d{4}\s\w{10}.*Demo', contents)
print(result)  #结果:<_sre.SRE_Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'>

#泛匹配
result =  re.match('Hello.*Demo$',content)
print(result)  #<_sre.SRE_Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'>
print(result.group())  #Hello 123 4567 World_This is a Regex Demo

#匹配目标
content ='Hello 1234567 World_This is a Regex Demo'
result = re.match('Hello\s(\d+)\sWorld.*Demo$',content)
#匹配括号里面的
print("############")
print(result.group())
print(result.group(1)) #1234567
print(result.span())   #(0,40)

#贪婪匹配
result = re.match('He.*(\d+).*Demo$',content)
print(result.group())
print(result.group(1)) #输出7  前面的1-6被.*匹配,贪婪模式

#非贪婪模式
result1 = re.match('He.*?(\d+).*Demo$',content)
result2 = re.match('He.*?(\d+).*?Demo$',content)
print(result2.group(1)) #
print(result1.group(1)) #输出1234567



#匹配模式
content = """Hello 1234567 World_This 
is a Regex Demo
"""
result1 = re.match('^He.*?(\d+).*?Demo$', content)
print(result1) #输出None  因为有换行符
result2 = re.match('^He.*?(\d+).*?Demo$', content,re.S)
print(result2) #输出None
print(result2.group(1))#1234567

#转义

content = 'price is $5.00'
result = re.match('price is $5.00',content)
print(result) #None
result = re.match('price is \$5\.00', content)
print(result)#<_sre.SRE_Match object; span=(0, 14), match='price is $5.00'>

"""
总结:尽量使用泛匹配,使用()得到匹配目标,尽量使用非贪婪模式、有换行符就用re.S
"""








评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

凯旋的皇阿玛

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值