python中正则表达式基本应用

最新推荐文章于 2024-05-14 09:59:09 发布

桃伊

最新推荐文章于 2024-05-14 09:59:09 发布

阅读量755

点赞数

分类专栏：爬虫填坑

本文链接：https://blog.csdn.net/weixin_42428357/article/details/100048918

版权

12 篇文章 0 订阅

订阅专栏

import re 
match_re = re.match(".*?(\d+).*", str_value)
if match_re:
    data = match_re.group(1)

re.match(pattern,string, flags=0)
1）简述：从第一个字符开始搜索，如果如果第一个不匹配则返回none，所以必须指定正则表达式打头信息。

content = “Hello 1234567 World. This is a Reges Demo”

2）匹配

result = re.match(“”,content,)
data = result.group() #返回匹配的对象
location = result.span() #返回匹配的内容在文本中的位置

3）泛匹配——.*（匹配任意多个字符）

data = result.match(“Hello.*Demo”,content)

4）匹配指定目标
括号内的正则表达式为指定的匹配目标，返回结果通过data.group()或data.groups()函数获得。

result = re.match(“Hello\s(\d+)\sWorld.*Demo$”,content)
# 括号括起来为匹配组，从1开始计数。
data = result.group(1)

5）贪婪匹配

result = re.match(“He.*(\d+).*Demo$”,content)
print(result.group(1))
# 输出：7
# 因为这样的正则表达式默认为贪婪匹配，.*会尽可能多的匹配字符，所以.*匹配了7以前的全部字符。

6）非贪婪匹配

result = re.match(“He.*?(\d+).*Demo$”,content)
# 输出：1234567
# 因为在.*后面加了?，匹配模式变成了非贪婪模式匹配，.*会匹配尽可能少的字符。

7）匹配模式

result = re.match(“”,content, re.S)
# re.S模式:设置后可以使.匹配到换行符

8）转义
转义通过‘\’实现，例如字符串中原本就存在.这样的字符，但是它并不是正则表达式，则在写成‘\.’即可表示字符‘.'的含义。

content = “Extra HEllo 123456 World. This is a Regex Demo Extra stings”
result = re.search(“Hello.*?(\d+).*?Demo”, content)

pattern =re.complie(“”, re.S)
result =re.match(pattern, content)

关注

专栏目录