Python的Re库详解（正则表达式）

最新推荐文章于 2023-05-23 11:18:42 发布

马马也

最新推荐文章于 2023-05-23 11:18:42 发布

阅读量1k

点赞数 2

分类专栏： python 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/machi1/article/details/90051062

版权

python 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

先贴一篇很好的正则表达式博文:https://www.cnblogs.com/darkterror/p/6474211.html

以及关于贪婪与懒惰匹配的博文:https://blog.csdn.net/wzygis/article/details/43339241

一.正则表达式的语法

1.正则表达式语法由字符和操作符构成。

2.正则表达式的常用操作符：

（1）. 表示任何单个字符

（2）[ ] 字符集，对单个字符给出取值范围

（3）[^] 非字符集，对单个字符给出排除范围

（4）* 其哪一个字符0次或无限次扩展

（5）+ 前一个字符1次或无限次扩展

（6）？前一个字符0次或1次扩展

（7）| 左右表达式任意一个

（8）{m} 扩展前一个字符m次（只对大括号前的一个字符进行扩展）

（9）{m,n} 扩展前一个字符m至n次（含n）

（10）^ 匹配字符串的开头例：^abc表示abc且在一个字符串的开头

（11）$ 匹配字符串结尾例：abc$表示abc且在一个字符串结尾

（12）( ) 分组标记，内部只能使用|操作符例：(abc|def)表示abc，def

（13）\d 数字，等价于[0-9]

（14）\w 单词字符，等价于[A-Za-z0-9_]

二.Re库的基本使用

1.调用方式:import re

2.正则表达式的表示类型:

(1)raw string类型(原生字符串类型)

re库采用raw string类型表示正则表达式,表示为:r'text',raw string是不包含转义符的字符串

(2)string类型,更繁琐

3.当正则表达式包含转义符时,使用raw string

4.Re库主要功能函数:

(1)re.search():在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象

(2)re.match():从一个字符串的开始位置匹配正则表达式,返回match对象

(3)re.findall():搜索字符串,以列表类型返回全部能匹配的子串

(4)re.split():将一个字符串按照正则表达式匹配结果进行分割,返回列表类型

(5)re.finditer:搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素时match对象

(6)re.sub:在一个字符串中替换所有匹配字符串的子串,返回替换后的字符串

5.Re库的另一种等价用法:

(1)函数式用法:一次性操作

例:rst = re.search(......)

(2)面向对象用法:编译后的多次操作

pat = re.compile(r'[1-9]\d{5}') #将一个正则表达式字符串变异成为正则表达式类型,python对象)

rst = pat.search('BIT 100081') #用python对象调用search方法

6.正则表达式对象:

regex = re.compile(pattern, flags=0) compile函数将正则表达式的字符串编译成正则表达式对象

三.Re主要功能函数详解

1.re.search(pattern, string, flags=0)

(1)pattern:正则表达式的字符串或原生字符穿表示

(2)string:带匹配的字符串

(3)flags:正则表达式使用时的控制标记

re.I:忽略正则表达式大小写,[A-Z]能匹配小写字符

re.M:正则表达式中的^操作符能够将给定字符串的每行当作匹配开始(本来^操作符只匹配字符串的串首,使用re.M后可以匹配字符串每行的行首

re.S:正则表达式的.操作符能够匹配所有字符,默认匹配除换行符外的所有字符(设置re.s,可以匹配换行符)

2.re.match(pattern, string, flags=0)

3.re.findall(pattern, string, flags=0)

4.re.split(pattern, string, maxsplit=0, flags=0)

(1)maxsplit:最大分割数,剩余部分作为最后一个元素输出

5.re.finditer(pattern, string, flags=0)

6.re.sub(pattern, repl, string, count=0, flags=0)

(1)repl:替换匹配字符串的字符串

(2)count:匹配的最大替换次数

四.Re库的match对象

1.match对象的属性:

(1).string 带匹配的文本

(2).re 匹配时使用的pattern对象(正则表达式)

(3).pos 正则表达式搜索文本的开始位置

(4).endpos 正则表达式搜索文本的结束位置

2.match对象的方法

(1).group(0):获得匹配后的字符串

(2).start():匹配字符串在原始字符串的开始位置

(3).end():匹配字符串在原始字符串的结束位置

(4).span():返回(.start(), .end())

五.Re库的贪婪匹配和最小匹配

1.Re库默认采用贪婪匹配,即输出匹配最长的子串

例:match = re.search(r'PY.*N', 'PYANBNCNDN')

match.group(0)

结果:PYANBNCNDN

分析:实际上在该原始字符串中,PYAN,PYANBN,PYANBNCN,PYANBNCNDN,都满足正则表达式,但结果输出了其中最长的PYANBNCNDN,这就叫贪婪匹配.

2.最小匹配:输出最短的字符串(在正则表达式中加一个?)

例;match = re.search(r'PY.*?N', 'PYANBNCNDN')

match.group(0)

结果为:PYAN

3.最小匹配操作符:

(1)*?:前一个字符0次或无限次扩展,最小匹配

(2)+?:前一个字符1次或无限次扩展,最小匹配

(3)??:前一个字符0次或1次扩展,最小匹配

(4){m, n}:扩展前一个字符m至n次(含n),最小匹配

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

马马也 CSDN认证博客专家 CSDN认证企业博客

码龄7年

99: 原创

4万+: 周排名

132万+: 总排名

19万+: 访问

: 等级

2990: 积分

80: 粉丝

162: 获赞

22: 评论

948: 收藏

私信

关注

热门文章

分类专栏

最新评论

通过jsp实现用户登陆和注销(通过session保存用户信息)
飞驰人生: <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>登陆界面</title> </head> <body> <form method="post" action="login.jsp"> 用户名<input type="text" name="username"><br> 密码<input type="password" name="passward"><br> <input type="submit" value="提交"> </form> <% String s1 = request.getParameter("username"); String s2 = request.getParameter("passward"); if(s1 == null&& s2 == null){ }else if(s1.equals("sdnu")&& s2.equals("1234")){ session.setAttribute("username", s1); session.setAttribute("password", s2); out.println("登陆成功" + "<br>"); out.println("<a href='welcome.jsp'>" + "点击这里返回主页面" + "</a>"); /* out.println(s1 + " , " + s2); out.println("用户名或密码错误"); */ } else{ //out.println(s1 + " , " + s2); out.println("用户名或密码错误"); /* session.setAttribute("username", s1); session.setAttribute("password", s2); out.println("登陆成功"); */ } %> </body> </html>
Java中使用try语句实现自动关闭输入输出流
yang834774322: 可以多行的，任何实现了java.lang.AutoCloseable、java.io.Closeable接口都可以被当做资源回收。而且里面仅有一条语句的话也不必有分号
数组倒序输出
信点什么好呢: 现在Collections.reverse（list）一行代码就完了
C语言中简单静态链表的建立实例
weixin_57345936: 简单的
C语言中简单静态链表的建立实例
weixin_57345936: 是

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。