目录
一、常用匹配规则介绍
正则表达式常用匹配规则(参考学习网址):正则表达式 – 语法 | 菜鸟教程
二、常用匹配方法
1.match
match方法中,第一个参数传入正则表达式,第二个参数是传入要匹配的字符串。
match方法会尝试从字符串的‘起始位置’开始匹配正则表达式,如果匹配,就返回匹配成功的结果;如果不匹配则返回None。实例如下:
import re
content = 'Hello 123 4567 World_This is a Regex Demo'
print(len(content)) #查看字符串的长度
result = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}',content)
#result = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}.*Demo$',content) #匹配所有字符
print(result)
print(result.group()) #返回匹配结果
print(result.span()) #输出范围
运行结果:
41 <re.Match object; span=(0, 25), match='Hello 123 4567 World_This'> Hello 123 4567 World_This (0, 25)
- 匹配目标
要想在一段文字中提取一部分内容,可以使用括号()将想要提取的子字符串括起来。()实际上标记了一个子表达式的开头和结束的位置,被标记的每个子表达式依次对应每个分组,调用group方法传入分组的索引就可以获取提取结果,实例如下:
import re
content = 'Hello 1234567 World_This is a Regex Demo'
result =