正则表达式

什么是正则表达式(非Python独有,re 模块实现):

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符,及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达的对字符串的一种过滤逻辑。

正则表达式测试网址: https://tool.oschina.net/regex

常见的匹配模式:

或者可以查看:https://www.runoob.com/python/python-reg-expressions.html
在这里插入图片描述

re.match函数

re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。
函数语法:
re.match(pattern, string, flags=0)
函数参数说明:
参数描述
pattern匹配的正则表达式
string要匹配的字符串。
flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。
常规匹配:
import re

content = "Hello 123 4567 World_This is a Regex Demo"

print(len(content))  # 打印字符长度
result = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}.*Demo$', content) # 进行匹配
print(result)  # 匹配结果
print(result.group())  # 打印匹配结果
print(result.span()) # 输出匹配结果的范围

效果如下:
在这里插入图片描述

泛匹配:
import re

content = "Hello 123 4567 World_This is a Regex Demo"
result = re.match('^Hello.*Demo$',content)  # 使用 .* 匹配所有字符串
print(result)
print(result.group())
print(result.span())

效果如下:
在这里插入图片描述

匹配目标:
import re
# 匹配 1234567
content = "Hello 1234567 World_This is a Regex Demo"
result = re.match('^Hello\s(\d+)\sWorld.*Demo$',content)  # \d+ 代表所有数据 
print(result)
print(result.group(1))   # (1)代表上一步(\d+)匹配的内容
print(result.span())

效果如下:
在这里插入图片描述

贪婪匹配:
import re

content = "Hello 1234567 World_This is a Regex Demo"
result = re.match('^He.*(\d+).*Demo$',content)   # 使用贪婪匹配 .* 会尽可能多的匹配,直到匹配不到位置
print(result)
print(result.group(1))   # 所以这里只留了最后一位数字 7 
print(result.span())

效果如下:
在这里插入图片描述

非贪婪匹配:
import re

content = "Hello 1234567 World_This is a Regex Demo"
result = re.match('^He.*?(\d+).*Demo$',content)  # ? 表示 非贪婪匹配 ,匹配可能少的字符,
print(result)
print(result.group(1))
print(result.span())

效果如下:
在这里插入图片描述

匹配模式:
import re

content = '''Hello 1234567 World_This
is a Regex Demo'''
result = re.match('^He.*?(\d+).*?Demo$',content,re.S) # .*不支持换行,引入第三参数解决
print(result)
print(result.group(1))
print(result.span())

效果如下:
在这里插入图片描述

转义
import re

content = 'price is $5.00'
result = re.match('price is \$5\.00',content)  # 遇特殊字符 使用 \ 进行转义
print(result)
print(result.group())
print(result.span())

效果如下:
在这里插入图片描述

总结 :尽量使用泛匹配,使用括号得到匹配目标,尽量使用非贪婪模式,有换行就使用 re.S 有特殊符合就使用转义 \ 。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值