#正则表达式学习笔记 import re """ .匹配任意字符 除换行符 {n}精确匹配前面n个表达式 \s 匹配任意的空白字符 \w 匹配字母数字及下划线 .* 匹配任意除换行符之外的字符 {n} 精确匹配n个前面表达式。 + 匹配1个或多个的表达式。 ( ) 匹配括号内的表达式 ? 匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式 re.S 如果不使用re.S参数,则只在每一行内进行匹配,如果一行没有,就换下一行重新开始,不会跨行 """ #re.match() 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()返回none #用法:re.match(pattern,string ,flags=0) flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。 """ 1.string与pattern完全相同,成功匹配 2.string虽然多出一个字母,但pattern匹配完成时,匹配成功,后面的字符不再匹配。 3.string匹配到最后一个字母时,发现仍然无法完全匹配,匹配失败。 """ content ='Hello 123 4567 World_This is a Regex Demo' contents ='Hello 123 4567 World_This is a Regex Demo ada' result = re.match('Hello\s\d{3}\s\d{4}\s\w{10}.*Demo$', content) print(result) print(type(result))#<class '_sre.SRE_Match'> print(len(content)) print(result.group())#返回匹配结果 Hello 123 4567 World_This is a Regex Demo print(result.span())#输出范围 (0,41) result = re.match('Hello\s\d{3}\s\d{4}\s\w{10}.*Demo', contents) print(result) #结果:<_sre.SRE_Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'> #泛匹配 result = re.match('Hello.*Demo$',content) print(result) #<_sre.SRE_Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'> print(result.group()) #Hello 123 4567 World_This is a Regex Demo #匹配目标 content ='Hello 1234567 World_This is a Regex Demo' result = re.match('Hello\s(\d+)\sWorld.*Demo$',content) #匹配括号里面的 print("############") print(result.group()) print(result.group(1)) #1234567 print(result.span()) #(0,40) #贪婪匹配 result = re.match('He.*(\d+).*Demo$',content) print(result.group()) print(result.group(1)) #输出7 前面的1-6被.*匹配,贪婪模式 #非贪婪模式 result1 = re.match('He.*?(\d+).*Demo$',content) result2 = re.match('He.*?(\d+).*?Demo$',content) print(result2.group(1)) # print(result1.group(1)) #输出1234567 #匹配模式 content = """Hello 1234567 World_This is a Regex Demo """ result1 = re.match('^He.*?(\d+).*?Demo$', content) print(result1) #输出None 因为有换行符 result2 = re.match('^He.*?(\d+).*?Demo$', content,re.S) print(result2) #输出None print(result2.group(1))#1234567 #转义 content = 'price is $5.00' result = re.match('price is $5.00',content) print(result) #None result = re.match('price is \$5\.00', content) print(result)#<_sre.SRE_Match object; span=(0, 14), match='price is $5.00'> """ 总结:尽量使用泛匹配,使用()得到匹配目标,尽量使用非贪婪模式、有换行符就用re.S """
正则表达式学习进程(一)re.match()
最新推荐文章于 2023-12-07 02:56:28 发布