廖雪峰python学习笔记【17】正则表达式

最新推荐文章于 2023-01-17 11:17:53 发布

HappyMrSpring

最新推荐文章于 2023-01-17 11:17:53 发布

阅读量353

点赞数

分类专栏： python学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liufuchun111/article/details/80763062

版权

python学习笔记专栏收录该内容

28 篇文章 1 订阅

订阅专栏

1. 元字符：

1.1 "\d" : 匹配一个数字。

1.2 "\w" : 匹配一个数字或字符。

1.3 "\s" : 匹配一个空格或tab等空白符。

1.4 ". " : 匹配任意一个字符。

1.5 "*" : 匹配任意个字符前面的字符（包括0个）。

1.6 "+" : 至少匹配一个前面的字符。

1.7 "？" : 匹配0个或1个前面的字符。

1.8 "{n}" : 前面的字符连续匹配n次。

1.9 "{n,m}" : 前面的字符连续匹配n至m次。

1.10 [ ]表示范围匹配：

1.10.1 [0-9a-zA-Z]: 表示匹配0-9或a-z或A-Z。

1.11 ^: 匹配行的开头。

1.12 $: 匹配行的结尾。

2. re模块

2.1 转义：

2.1.1 匹配1234-1234567的正则表达式可以用"123\-1234567"。"-"是特殊字符需要转义。

2.1.2 表示正则表达式"123\-1234567"的python字符串是"123\\-1234567"，"\"本身也需要转义。因此python字符串最好使用"r"前缀，即：r'123\-1234567'表示python字符串。

3. 切分字符串

3.1 'a b c'.split(' ') == ['a', 'b', ' ', 'c'] # 字符串对象的split方法无法识别连续的空格。

3.2 re.split(r'[\s]+', 'a b c') == ['a', 'b', 'c'] #可以切分多个连续的空格。

4. 分组：

4.1 正则表达式除了判断是否匹配外，还能提取子串。用()表示要提取的分组。

4.2 示例：

4.2.1 m = re.match(r'.*(\d{4}).*\-.*(\d{7}).*', 'a1234a-a1234567a')。

4.2.2 Match对象m的group方法用来获取分组。m.group(0): 表示原始字符串；m.group(1) : 表示第一个分组；m.group(2) : 表示第二个分组。

4.2.3 m.groups() # 返回一个存储有所有分组信息的tuple。

5. 贪婪匹配

5.1 正则匹配默认是贪婪匹配。即匹配尽可能多的字符。

5.2 示例：

5.2.1 re.match(r'^(\d+)(0*)$', '102400').groups == ('102400', '')

5.2.2 使用"?"后，可以改为非贪婪匹配：

5.2.3 re.match(r'^(\d+?)(0*)$', '102400').groups == ('1024', '00')

6. 编译：

6.1 使用re.match时，re模块做了两件事：

6.1.1 编译正则表达式；

6.1.2 用编译后的正则表达式匹配去匹配字符串；

6.2 如果同一个正则表达式需要多次使用，则可以将正则表达式预编译好，提升效率。示例：

6.2.1 re_tel = re.compile(r'^(\d{4})\-(\d{7})$')

6.2.2 re_tel.match('1234-1234567').groups() == ('1234', '1234567')

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
廖雪峰python学习笔记【17】正则表达式

1. 元字符： 1.1 "\d" : 匹配一个数字。 1.2 "\w" : 匹配一个数字或字符。 1.3 "\s" : 匹配一个空格或tab等空白符。 1.4 ". " : 匹配任意一个字符。 1.5 "*" : 匹配任意个字符前面的字符（包括0个）。 1.6 "+" : 至少匹配一个前面的字符。 1.7 "？" : 匹
复制链接

扫一扫

专栏目录

HappyMrSpring CSDN认证博客专家 CSDN认证企业博客

码龄12年

97: 原创

5万+: 周排名

1万+: 总排名

37万+: 访问

: 等级

3809: 积分

142: 粉丝

216: 获赞

31: 评论

971: 收藏

私信

关注

分类专栏

最新评论

CRC常用参数模型及C#代码实现
chialy: 常见CRC参数模型表中多项式有误，如8005应为18005等可参考https://crcmod.sourceforge.net/crcmod.predefined.html
linux系统编程之信号（一）：信号基本概述
码咔吧咔: [code=csharp] void System_Reboot()//系统重启函数 { sync();//？？？？ usleep(1*1000*1000);//休眠 sighandler_t old_handler;//？？？？ old_handler = signal(SIGCHLD, SIG_DFL);//？？？？ system("reboot");//重启 signal(SIGCHLD, old_handler);//？？？？ } [/code] 博主可不可以用通俗易懂的话，讲解一下问号语句的代码含义
关于VLAN和VXLAN的理解
Yealon6: 真大佬，从VLAN追过来的，太强了
Linux中断处理流程
qiuzen: 请教大侠：能否用C语言或者汇编代码模拟生成一个按下键盘某个键的中断？就是想用软件模拟物理的键盘敲击
关于posix_memalign( )函数的坑
m0_48861246: 这个函数出错是不会给你分配内存,所以你free炸了,但函数不会往error内写错误信息,所以程序不会抛出.但他的返回值可以反馈错误与否和错误原因.所以注意调用这个函数后检查是否成功.

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。