Python 正则使用

最新推荐文章于 2024-01-02 15:44:10 发布

默默前行的旅者

最新推荐文章于 2024-01-02 15:44:10 发布

阅读量217

点赞数 1

分类专栏： Python 基础文章标签： python 正则表达式

本文链接：https://blog.csdn.net/weixin_43229819/article/details/106782288

版权

Python 基础专栏收录该内容

22 篇文章 0 订阅

订阅专栏

单字修饰符：
1. . 匹配任意字符，除了换行符
2. [] 用来表示一组字符,单独列出：[abc] 匹配 ‘a’，‘b’或’c’
3. \d 匹配任意数字，等价于 [0-9].
4. \D 匹配任意非数字
5. \w 匹配字母数字及下划线
6. \W 匹配非字母数字及下划线
7. \s 匹配任意空白字符，等价于 [\t\n\r\f].
8. \S 匹配任意非空字符

数量修饰符
1.* 匹配0个或多个的表达式
2.+ 匹配1个或多个的表达式
3.? 匹配0个或1个由前面的正则表达式定义的片段
4.{m} 前面字符出现m次
5.{m,} 前面字符出现至少m次
6.{m,n}前面字符出现m~n次

边界修饰符
1.^ 以…开始
2.$ 以…结尾
eg:
‘^abc’ 匹配以abc开头
‘abc$’ 匹配以abc结尾

分组修饰符
1.() 匹配括号内的表达式，也表示一个组
2.\1 \2 匹配第1、2个分组的内容
eg:

   （.*）:(.*)
    	\1  \2

贪婪模式非贪婪模式
贪婪模式：在整个表达式匹配成功的前提下，尽可能多的匹配 ( * )；
非贪婪模式：在整个表达式匹配成功的前提下，尽可能少的匹配 ( ? )；
Python里数量词默认是贪婪的。
示例一：源字符串：abbbc
使用贪婪的数量词的正则表达式 ab* ，匹配结果： abbb。
* 决定了尽可能多匹配 b，所以a后面所有的 b 都出现了。
使用非贪婪的数量词的正则表达式ab*?，匹配结果： a。
即使前面有 *，但是 ? 决定了尽可能少匹配 b，所以没有 b。

      示例二 ： 源字符串：aa<div>test1</div>bb<div>test2</div>cc
      使用贪婪的数量词的正则表达式：<div>.*</div>
      
      匹配结果：<div>test1</div>bb<div>test2</div>
      这里采用的是贪婪模式。在匹配到第一个“</div>”时已经可以使整个表达
      式匹配成功，但是由于采用的是贪婪模式，所以仍然要向右尝试匹配，
      查看是否还有更长的可以成功匹配的子串。匹配到第二个“</div>”后，
      向右再没有可以成功匹配的子串，匹配结束，匹配结果为
      “<div>test1</div>bb<div>test2</div>”

      使用非贪婪的数量词的正则表达式：<div>.*?</div>
      匹配结果：<div>test1</div>
      正则表达式二采用的是非贪婪模式，在匹配到第一个“</div>”
      时使整个表达式匹配成功，由于采用的是非贪婪模式，
      所以结束匹配，不再向右尝试，匹配结果为“<div>test1</div>”。

模式修饰符
regular expression
1.re.S 单行模式
2.re.M 多行模式
3.re.I 忽略大小写

使用步骤：
re.complie()
compile 函数用于编译正则表达式，生成一个正则表达式Pattern对象
Pattern对象 = re.compile(正则表达式)
Pattern对象.find all（html）
findall()
在字符串中找到正则表达式所匹配的所有子串，并返回一个列表，如果没有找到匹配的，则返回空列表。

默默前行的旅者

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python 正则使用

单字修饰符：1. . 匹配任意字符，除了换行符2. [] 用来表示一组字符,单独列出：[abc] 匹配 ‘a’，‘b’或’c’3. \d 匹配任意数字，等价于 [0-9].4. \D 匹配任意非数字5. \w 匹配字母数字及下划线6. \W 匹配非字母数字及下划线7. \s 匹配任意空白字符，等价于 [\t\n\r\f].8. \S 匹配任意非空字符数量修饰符1.* 匹配0个或多个的表达式 2.+ 匹配1个或多个的表达式3.? 匹配0个或1个由前面
复制链接

扫一扫