正则表达式的最短与最长匹配

贪婪与懒惰

当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。考虑这个表达式:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。

有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。现在看看懒惰版的例子吧:

a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab(第一到第三个字符)ab(第四到第五个字符)

为什么第一个匹配是aab(第一到第三个字符)而不是ab(第二到第三个字符)?简单地说,因为正则表达式有另一条规则,比懒惰/贪婪规则的优先级更高:最先开始的匹配拥有最高的优先权——The match that begins earliest wins。

表5.懒惰限定符
代码/语法说明
*?重复任意次,但尽可能少重复
+?重复1次或更多次,但尽可能少重复
??重复0次或1次,但尽可能少重复
{n,m}?重复n到m次,但尽可能少重复
{n,}?重复n次以上,但尽可能少重复

实例:在一段SQL里面,替换掉全部的时间(如:'18-JUL-14 10.32.23.000000 AM')为to_date('20150202','yyyymmdd'),就可以在任何一款支持正则表达式的文本编辑器里面实现,如notepad++。表达式为:

(\ '\d{2}(-JUL).+?AM')   ,以下是解释:

\ '     以‘开始

\d{2}    两位数字

(-JUL)  包含-JUL

.+    任意字符任意多个

?    第一次匹配到AM'

AM'    以AM'结尾

insert into mstb_delivery_charge (ID, DISTRICT_ENAME, DISTRICT_CNAME, SUB_DISTRICT_ENAME, SUB_DISTRICT_CNAME, DIS_CODE, DIS_MINDP, DIS_CHARGE, REGION_CODE, CREATED_TIMESTAMP, MODIFIED_TIMESTAMP, POST_CODE, EXPRESS_VENDOR, POST_TIMEAREA_RANGE, DIS_SEQUENCE)
values (POS5G_RW.MSSQ_DELIVERY_CHARGE_ID.NEXTVAL, 'Xin Bei', '新北市', 'Ying Ge', '鶯歌區', '0', 2000.00, 150.00, '130', '18-JUL-14 10.32.23.000000 AM', '18-JUL-14 10.32.23.000000 AM', '239', '', 'All', 30239);

insert into mstb_delivery_charge (ID, DISTRICT_ENAME, DISTRICT_CNAME, SUB_DISTRICT_ENAME, SUB_DISTRICT_CNAME, DIS_CODE, DIS_MINDP, DIS_CHARGE, REGION_CODE, CREATED_TIMESTAMP, MODIFIED_TIMESTAMP, POST_CODE, EXPRESS_VENDOR, POST_TIMEAREA_RANGE, DIS_SEQUENCE)
values (POS5G_RW.MSSQ_DELIVERY_CHARGE_ID.NEXTVAL, 'Xin Bei', '新北市', 'San Chong', '三重區', '0', 2000.00, 150.00, '130', '18-JUL-14 10.32.23.000000 AM', '18-JUL-14 10.32.23.000000 AM', '241', '', 'All', 30241);


  • 5
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: JavaScript 中的正则表达式可以使用 `?` 字符来实现最匹配。例如,在表达式 `a?` 中,`?` 表示前面的字符 `a` 可以出现 0 次或 1 次,所以它会尽可能少地匹配字符串中的字符。 例如,如果要匹配字符串 "aaa" 中的最前缀 "a",可以使用表达式 `a?`: ``` let regex = /a?/; let str = "aaa"; let match = str.match(regex); console.log(match[0]); // 输出 "a" ``` 同样的,如果要匹配字符串 "aaa" 中的最后缀 "a",也可以使用表达式 `a?`: ``` let regex = /a?$/; let str = "aaa"; let match = str.match(regex); console.log(match[0]); // 输出 "a" ``` 此外,还可以使用 `*` 和 `+` 字符来实现最匹配。例如,在表达式 `a*` 中,`*` 表示前面的字符 `a` 可以出现 0 次或多次,所以它也会尽可能少地匹配字符串中的字符。在表达式 `a+` 中,`+` 表示前面的字符 `a` 至少出现 1 次,所以它也会尽可能少地匹配字符串中的字符。 例如,如果要匹配字符串 "aaa" 中的最前缀 "a",可以使用表达式 `a*`: ``` let regex = /a*/; let str = "aaa"; let match ### 回答2: 正则表达式中,默认是最长匹配。如果想要实现最匹配,可以使用非贪婪模式。在正则表达式后面加上"? "即可设置非贪婪模式。 例如,我们有字符串"ababab",想要匹配其中的"aba"。如果使用正则表达式 /a.*a/ ,它将会匹配整个字符串"ababab",这是最长匹配。如果我们想要实现最匹配,可以使用非贪婪模式,将正则表达式修改为 /a.*?a/ 。这样,它将会匹配到最的"aba"。 在非贪婪模式中,"."表示匹配任意字符,"*"表示重复0次或多次,"? "表示非贪婪匹配。 在JavaScript中,非贪婪模式也适用于其他正则相关的方法,如replace()、split()等。可以通过在相应的方法中使用非贪婪模式来实现最匹配。 ### 回答3: 在JavaScript中,正则表达式默认使用贪婪模式进行匹配,即尽可能多的匹配符合条件的字符。但是有时候我们希望对某些特殊情况进行最匹配。 要实现最匹配,可以使用非贪婪量词`?`。在正则表达式中,`?`用于表示在匹配模式的后面添加一个问号,表示尽可能少的匹配。 举例来说,假设我们有一个字符串`"abbbbc"`,我们想要匹配的连续的`b`字符。如果使用贪婪模式,那么正则表达式`/b+/`会匹配整个字符串`"abbbbc"`,因为它尽可能多的匹配`b`字符。但是如果我们想要匹配的连续的`b`字符,可以使用非贪婪量词`?`,即`/b+?/`。这样,它只会匹配到第一个`b`字符。 另外,还可以使用括号来限定最匹配的范围。例如,假设我们有一个字符串`"abbbbcd"`,我们想要匹配从第一个`b`字符到第一个`c`字符之间的内容。可以使用正则表达式`/b(.*?)c/`,其中`.*?`表示任意字符的最匹配。这样,它会匹配到`"b"`和`"bcd"`之间的内容。 通过使用非贪婪量词`?`和括号来限定最匹配的范围,我们可以在JavaScript中实现最匹配的功能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

0X码上链

你的鼓将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值