python中正则表达式基本应用
基本应用
import re
match_re = re.match(".*?(\d+).*", str_value)
if match_re:
data = match_re.group(1)
在线正则表达式测试
在线正则表达式测试网页
re模块
- re.match(pattern,string, flags=0)
1)简述:从第一个字符开始搜索,如果如果第一个不匹配则返回none,所以必须指定正则表达式打头信息。
content = “Hello 1234567 World. This is a Reges Demo”
2)匹配
result = re.match(“”,content,)
data = result.group()
location = result.span()
3)泛匹配——.*(匹配任意多个字符)
data = result.match(“Hello.*Demo”,content)
4)匹配指定目标
括号内的正则表达式为指定的匹配目标,返回结果通过data.group()或data.groups()函数获得。
result = re.match(“Hello\s(\d+)\sWorld.*Demo$”,content)
data = result.group(1)
5)贪婪匹配
result = re.match(“He.*(\d+).*Demo$”,content)
print(result.group(1))
6)非贪婪匹配
result = re.match(“He.*?(\d+).*Demo$”,content)
7)匹配模式
result = re.match(“”,content, re.S)
8)转义
转义通过‘\’实现,例如字符串中原本就存在.这样的字符,但是它并不是正则表达式,则在写成‘\.’即可表示字符‘.'的含义。
- re.search()
整个扫描文本,找到第一个匹配的项,返回结果。所以一般常用re.search()方法做正则匹配。
content = “Extra HEllo 123456 World. This is a Regex Demo Extra stings”
result = re.search(“Hello.*?(\d+).*?Demo”, content)
- re.findall()
查询符合条件的所有结果。返回列表类型,列表元素为元组。 - re.sub()
替换字符串中的每一个匹配的字串后返回替换后的字符串。
参数:正则表达式,要替换的字符串,源字符串 - re.complie()
将正则表达式编译成正则表达式对象
pattern =re.complie(“”, re.S)
result =re.match(pattern, content)