python正则表达式花括号_python正则表达式（+ {}）（二）

最新推荐文章于 2024-02-24 17:50:44 发布

weixin_39675178

最新推荐文章于 2024-02-24 17:50:44 发布

阅读量1k

点赞数

文章标签： python正则表达式花括号

加号-重复匹配多次

+ 表示匹配前面的子表达式一次或多次，不包括0次

比如，还是上面的例子，你要从文本中，选择每行逗号后面的字符串内容，包括逗号本身

但是，添加一个条件，如果逗号后面没有内容，就不要选择了。

比如，下面的文本中，最后一行逗号后面没有内容了，就不要选择了

苹果，是绿色的

橙子，是橙色的

香蕉，是黄色的

乌鸦，是黑色的

猴子，

就可以这样写正则表达式，.+

验证一下如下图所示( + 和 * 的区别就是：不包括0次，所以没有选中最后一行)：

，.+

绿色+

.+色

最后一行，猴子逗号后面没有其他字符了，但是?表示匹配一次或0次，所以最后一行也选中了一个逗号字符

，.?

花括号-匹配指定次数

花括号表示前面的字符匹配指定的次数

比如，下面的文本

红彤彤，绿油油，黑乎乎，绿油油油油

表达式油{3,4}就表示匹配连续的油字至少3次，至多4次

实际可以应用于获取手机号：

贪婪模式和非贪婪模式

我们要把下面的字符串中所有html标签都提取出来

source='

Title

得到这样的一个列表：

['','

','','']

很容易想到使用正则表达式<.*>

写出如下代码

source='

Title

imort re

p=re.compile(r'<.*>')

print(p.findall(source))

运行结果却是：

['

Title']

怎么回事？原来在正则表达式中，' * ',' + ', ' ? '都是贪婪的，使用他们时，会尽可能多的匹配内容

所以，<.*> 中的星号（表示任意次数的重复），一直匹配到了字符串最后的里面的e。

解决这个问题，就需要使用非贪婪模式，也就是在星号后面加上?,变成这样<.*?>

代码改为：

source='

Title'

imort re

p=re.compile(r'<.*?>')

print(p.findall(source))

weixin_39675178

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python正则表达式花括号_python正则表达式（+ {}）（二）

加号-重复匹配多次+ 表示匹配前面的子表达式一次或多次，不包括0次比如，还是上面的例子，你要从文本中，选择每行逗号后面的字符串内容，包括逗号本身但是，添加一个条件，如果逗号后面没有内容，就不要选择了。比如，下面的文本中，最后一行逗号后面没有内容了，就不要选择了苹果，是绿色的橙子，是橙色的香蕉，是黄色的乌鸦，是黑色的猴子，就可以这样写正则表达式，.+验证一下如下图所示( + 和 * 的区别就是：不...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。