python正则表达式

最新推荐文章于 2022-03-30 19:58:16 发布

math_computer

最新推荐文章于 2022-03-30 19:58:16 发布

阅读量160

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/math_computer/article/details/103491673

版权

47 篇文章 1 订阅

订阅专栏

参考：

项目案例：罗攀，蒋仟《从零开始学Python网络爬虫》

不错的讲解：http://www.regexlab.com/zh/regref.htm（注意未必与python的正则表达式规则相同）

学习过程：1. 大概的使用方法，2. 需要的积累查阅，3. 系统的总结沉淀

1. 大概的使用方法

一般字符：., \, [...]

预定义字符集：\d, \D, \s, \S, \w, \W

数量词：*, +, ?, {m}, {m,n}

边界匹配：^, $, \A, \Z, \b

常见例子：re.S模式下， r‘(.*?)’表示以非贪婪模式匹配任何字符（如果不是re.S模式，则表示除了\n之外的任何字符），返回括号中的模式内容，具体使用见2.中非贪婪模式例子

注意：\w包含数字，字母以及下划线，但是不包括-

例子：

result1 = re.findall(r'\w{2}', '_21-c34d-56_e78')
print(result1) #输出：['_2', 'c3', '4d', '56', '_e', '78']

import re

results = re.findall(patt, string, flags)

例子：

result1 = re.findall(r'\d{2}', '21c34d56e78')
print(result1) #输出：['21', '34', '56', '78']

import re
s="我是（一个人)(中国人)aaa[真的]bbbb{确定}".replace("（", "(").replace("）", ")")
a = re.sub(r"\(.*?\)", "", s)
print(a)  #我是aaa[真的]bbbb{确定}

2. 需要的积累查阅

例子：

result3 = re.findall(r'<p>(.*?)</p>', '<p>21c34d56e78</p>abc<p></p>7634', re.S)
print(result3) #输出：['21c34d56e78', '']

3. 系统的总结沉淀

关注