正则表达式4____重复匹配(2)

109905418

已于 2022-11-07 20:56:25 修改

阅读量1.3k

点赞数

分类专栏：正则表达式文章标签：正则表达式

于 2011-11-17 01:26:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aduovip/article/details/6979996

版权

正则表达式专栏收录该内容

6 篇文章 0 订阅

订阅专栏

为了对重复性匹配有更多的控制，正则表达式提供了一个用来设定重复次数(interval) 的语法,重复次数用{}来指定

{和}是元字符，如果需要匹配{和}本身，必须用\对它们进行转义.

1 为重复匹配次数设定一个精确的值

如匹配一个RGB值， #[[:xdigit:]]{6} 或#[0-9a-fA-F]{6}就可以实现

2 为重复匹配次数设定一个区间

{}可以用来为重复匹配次数设定一个区间,也就是为重复匹配次数设定一个最小值和一个最大值.

看一个例子

4/8/03 10-6-2004 2/2/2 01-01-01

正则表达式 : \d{1,2}[-\/]\d{1,2}[-\/]\d{2,4}

结果

4/8/03 10-6-2004 2/2/2 01-01-01

在这个例子中，使用了/的转义序列\ /, 实际上在许多正则表达式中是不必要的, 但最好还是使用转义符号

{0,3}表示重复次数可以是0,1,2,3 ,另外? 等价于{0,1}

3 匹配至少重复多少次

用法 {3, }:表示至少重复3次, 注意: 如果遗漏大括号里的“，” 将变成精确匹配

4 防止过度匹配

*,+ 都是所谓“贪婪型” 元字符

看一个示例, 请仔细体会

This offer is not available to customers living in <B>AK</B> and <B>HI</B>

正则表达式 <[Bb]>.*?</[Bb]>

结果

This offer is not available to customers living in <B>AK</B> and <B>HI</B>

注意如果表达式为 <[Bb]>.*</[Bb]> ，将匹配一个,从第一个<B>匹配到最后一个</B>, 因为*和+都是所谓的"贪婪型" 元字符,它们在进行匹配时是多多益善，而不是适可而止,

它们会尽可能地从一段文本的开头一直匹配到这段文本的末尾，而不是从这段文本的开头匹配到碰到第一个匹配时为止.

要解决这个问题，需要使用这些元字符的 "懒惰型" 版本, 也就是匹配尽可能少的字符，懒惰型元字符语法：只要给贪婪型元字符加上一个?后缀即可

常用的贪婪型元字符和它们的懒惰型版本

___________________________________________________________________________

贪婪型元字符懒惰型元字符

___________________________________________________________________________

* *?

+ +?

{n, } {n, } ?

___________________________________________________________________________

*? 是 * 的懒惰型版本, 在上面例子中，使用了懒惰的 *?, 第一个匹配将仅限于AK,原始文本里的 <B>HI</B>成为了第二个匹配

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则表达式4____重复匹配(2)

为了对重复性匹配有更多的控制，正则表达式提供了一个用来设定重复次数(interval) 的语法,重复次数用{}来指定{和}是元字符，如果需要匹配{和}本身，必须用\对它们进行转义.1 为重复匹配次数设定一个精确的值如匹配一个RGB值， #[[:xdigit:]]{6} 或#[0-9a-fA-F]{6}就可以实现2 为重复匹配次数设定一个区间{}可以用来为重复匹配次数设定一个区间
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。