python中的正则表达式

最新推荐文章于 2023-05-26 10:00:02 发布

“光光”

最新推荐文章于 2023-05-26 10:00:02 发布

阅读量180

点赞数

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_69619434/article/details/124661297

版权

在正则表达式中，如果直接给出字符，就是精确匹配。

\d可以匹配一个数字

比如：'\d\d\d'可以匹配'007',但是无法匹配'00A'

\w可以匹配一个字母或者数字

比如：'\w\w\d'可以匹配'py3'

.可以匹配任意字符

比如：'py.'可以匹配'pyc'、'pyo'、'py!'等等

要匹配变成的字符，在正则表达式中，用*表示任意个字符（包括0个），用+表示至少一个字符，用？表示0个或者1个字符，用｛n｝表示n个字符，用｛n,m｝表示n-m个字符：

比如：

\d{3}\s+\d{3,8}

从左到右解读一下：

\d{3}表示匹配3个数字，例如'010'

\s可以匹配一个空格（也包括Tab等空白页）所以\s+表示至少有一个空格，例如匹配'',' '

\d{3,8}表示3-8个数字，例如：'1234567'

综合起来，上面的正则表达式可以匹配以任意个空格隔开的带区号的电话号码。

要做更精确的匹配，可以用[]表示范围，比如：

[0-9a-zA-Z\_]可以匹配一个数字、字母或者下划线

[0-9a-zA-Z\_]+可以匹配至少一个数字、字母或者下划线组成的字符串，比如：'a100','0_z','Py300'等等

[a-zA-z\_][0-9a-zA-Z\_]*可以匹配由字母或者下划线开头，后接任意个由一个数字、字母或者下划线组成的字符串，也就是Python的合法变量。

[a-zA-Z\_][0-9a-zA-Z\_]{0,19}更加精确的确认了长度是1-20个字符（前面1个字符+后面最多19个字符）

A|B可以匹配A或者B,所以[P|p]ython可以匹配'Python或者python'

^表示行的开头，^\d表示以数字开头

$表示行的结束，\d$表示以数字结束

re模块

python提供了re模块，包含了所有正则表达式的功能。

需要注意的是Python字符串本身也用\转义，所以要特别注意：

s='ABC\\-001'

#python的字符串对应的正则表达式字符串变成：'ABC\-001'

强烈建议使用Python的r前缀，就不用考虑转义问题了。

s =r'ABC\-001'

match方法判断是否匹配，如果匹配成功，返回一个Match对象，否则返回None:

>>>import re

>>>re.match(r'^\d{3}\-\d{3,8}$','010-12345')

<_are.SRE_Match object;span=(0,9),match='010-12345'>

>>>re.match(r'^\d{3}\-\d{3,8}$','010 12345')

>>>

用正则表达式切分字符串：

>>>'a b c'.split(' ')

['a','b','','','c']

无法识别连续的空格，用正则表达式试试：

>>>re.split(r'\s+','a b c')

['a','b','c']

无论多少空格和逗号都可以正常分割：

>>>re.split(r'[\s\,]+','a,b,c d')

['a','b','c','d']

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python中的正则表达式

在正则表达式中，如果直接给出字符，就是精确匹配。\d可以匹配一个数字比如：'\d\d\d'可以匹配'007',但是无法匹配'00A'\w可以匹配一个字母或者数字比如：'\w\w\d'可以匹配'py3'.可以匹配任意字符比如：'py.'可以匹配'pyc'、'pyo'、'py!'等等要匹配变成的字符，在正则表达式中，用*表示任意个字符（包括0个），用+表示至少一个字符，用？表示0个或者1个字符，用｛n｝表示n个字符，用｛n,m｝表示n-m个字符：比如：\d{3}\s+\d{3
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。